真实测试GPT-3.5模型

GPT-4o2024-05-09387

01

心情日志

Oct 5th

晴空万里，正是享受假期的好时光。这些宝贵的日子总是转瞬即逝，但它们留下了美好的回忆。虽然离上班还有2天，但不要忧虑，继续充实假期，充满活力地迎接新的工作挑战。生活中的轮回，正是生命的精彩之处！☀️🌤️😊

02

知识分享

Knowledge & sharing

一、大模型简介

OpenAI 是一家总部位于美国的人工智能研究公司，成立于 2015 年，其宗旨是实现安全的通用人工智能（AGI）并让其有益于人类。OpenAI 在人工智能领域的研究一直处于领先地位，其开发的一系列大模型在自然语言处理、计算机视觉、自然语言生成等领域取得了重要突破。

OpenAI的主要目标是研发通用人工智能(AGI)，这种人工智能能够执行多种智能任务，甚至可以与人类一样地思考和学习。为了达成这个目标，OpenAI在深度学习、自然语言处理、机器人技术和游戏AI等领域进行了大量的研究和探索。

目前为止，OpenAI已经发布了四代GPT产品：GPT-1 ，GPT-2 ，GPT-3 和最新发布的GPT-4 。每一代都比前一代有着显著地性能提升和功能拓展。

例如：

- GPT-1只有117M个参数，并且只使用了英文维基百科作为训练数据集，在12种NLP任务上取得了与当时最先进水平相当或略高于最先进水平结果。

- GPT-2拥有15亿个参数，并且使用了WebText数据集作为训练数据集，在7种零次微调下游任务上取得了与当时最先进水平相当或超过最先进水平结果。

- GPT-3拥有1750亿个参数，并且使用了Common Crawl数据集作为训练数据集，在20种零次微调下游任务上取得了超过当时最先进水平结果。

- GPT-4拥有10000亿个参数，并且使用了Common Crawl+数据集作为训练数据集，在30种零次微调下游任务上取得了超过当前最先进水平结果。

二、语言测试阶段

我们就来考考它。看看它能不能给我不一样的表现。

开始我们的测试！！

GPT-3.5 UI界面：

UI界面风格的设计的非常随意

发现问题：UI页面缩放网页，UI的界面不会自动修改文字大小和规格。网页缩的越小，文字就越大。

知识库截止日期为2021年9月

GPT-4 这个是花钱才能使用的功能！暂时没钱无法测试，等有机会给大家测试。但是GPT可以添加组件，写作和制作视频方便好用。

知识库是最新！！

2023年3月14日，美国人工智能研究实验室OpenAI为聊天机器人ChatGPT发布了GPT-4语言模型。

2023年3月15日，微软副总裁兼消费者首席营销官Yusuf Mehdi发文确认新必应搜索引擎运行GPT-4。

2023年5月消息，在和OpenAI达成合作后，微软正全面与ChatGPT对接。先是GPT-4全面接入Office；随后，必应成为ChatGPT的内置搜索引擎。

5月24日，微软在其年度Build开发者大会上宣布，将在Windows 11中加入一个名为Copilot的AI助手。

正式开始测试

Let‘s GO

1.测试一段方言，看看生成速度和翻译的是否正确。

河南方言：

假如生活搉了你，别（bê）吭气，别（bê）邪吙，别（bê）日挠，别（bê）打渣子，别（bê）枯雏着脸，别（bê）癔而八症，你就从哪拌倒从哪骨永起来，最后你会发现，你会变得可幸可幸嘞！[翻译成普通话]

发现GPT-3.5有做优化，人的感知，马上就体现出来。而且他会给出自己的讲解！！

其他方言：多种测试

回答的每个问题都有序号，这个是非常小的细节，但是我测试这么多模式，第一次看见这种的。赞

方便查询询问的每一个词语，并查看哪些提问遗漏。

回答内容没问题，但是需要提示词做引导才能正确回答，说明他不能自助的判断这个提问是做什么？

发现训练了几次，就会自动翻译方言。

每个提问都能给出故事的解释并能完美的翻译方言。

测试结果：

成功

2.每天提问多少个对话

测试结果：

对话无限制可放心使用

3.翻译测试：

这回加大难度，来测试一下好用否？

诗词翻译和出处都有问题。

下面来看看国产AI的回答，是不是让你看着更舒服。这个就是中国的AI。

哈哈哈~~

中国的AI，必须遥遥领先。

老祖宗的东西不能丢~~

这个就是中国~我爱的祖国

古诗词测试效果：

文言文和古诗词打0分，翻译极差。

不通过

梵语梵文佛经测试如下：

纠正完，已经改过来了。在生成一个新的会话试试看

这个是大悲咒，属于心经一部分？

对佛经不懂得小白，暂时不做评论。

但是我网上找到的知识，分享一下。

测试结果：

不通过

英文翻译如下：

发现问题：

不能自助快速识别操作者想做什么？而是和我对话，除非使用者使用提示词才开始翻译。

开始有提示词翻译

测试结果：

成功

4.模拟情感思维模式

chatgpt对于分析心理和情感真的是有一手，赞！

测试结果：

成功

5.AI安全措施检测

记得原来还能问出来如何制造，还告诉你大概钢管的型号等相关信息，现在说明AI安全法出台，做了优化。

测试结果：

成功

6.测试情景思维模式

发现的问题所在：

人员安排没有详细写出具体的工作都需要做什么？

流程写还算可以，但是没有达到预想，不知道是不是GPT-3.5的缘故。知识库太老了！！

我需要看到的是这样的流程和人员安排效果！！

如下图所示：

测试结果：

成功

6.逻辑推理测试

测试结果：

成功

7.生成图片

应该是需要使用插件才能生成最优秀的图片！

测试结果：

不通过

优点：

可以生成连贯、一致的长文本,语义连贯性更强,逻辑清晰。
强大的语义理解能力，能理解复杂句子并做出响应。
覆盖多个领域很强大。
对查询的理解和编码更加准确,可以处理更复杂的问题。
在代码生成、数学运算、词义推断等方面都取得突破,应用范围更广。
可以进行复杂的多步推理,回答需要分析和推理的问题。
对话系统可以进行更贴近人类的自然问答。
提供API免费接口方便第三方平台调用。

缺点：

回答的问题有错误，但是无法矫正。
前端页面缩小，文字大小和规格不会改变。
大模型可能被利用生成有害内容,需要对输出加强监管。
世界各方面的知识还需要更多的积累。
使用也有风险，用户把公司的代码询问GPT就会有被泄露的危险。
回答不出来的问题会生成一个虚假信息，如果不懂的话会让你很难发现这个问题。

结语：

OpenAI 大模型在人工智能领域的应用前景非常广泛，可以应用于自然语言处理、计算机视觉、语音识别、推荐系统、智能对话等领域。随着 OpenAI 大模型的不断升级和改进，它们在各个领域的应用效果也在不断提高，为人工智能领域的研究和应用提供了有力支撑。

总之，OpenAI 大模型作为一种新型的人工智能技术，其强大的能力和广泛的应用前景，正在引领人工智能进入一个新时代。随着 OpenAI 大模型的不断发展和完善，它们将在人工智能领域的研究和应用中发挥越来越重要的作用，为人类社会的进步和发展做出重要贡献。

喜欢的小伙伴记得点个赞，捧个场！！！

03

关于与分享

Follow & Share

各位转载和做公众号的小伙伴，请备注出处。凯伊发表内容不易，请尊重劳动成果。

各位感觉我输出的文章质量不错，读后收获很大，预计能为您提高 10% 的工作及娱乐技能，点击“点赞和再看”我一下，让我有动力继续写出更多好文章。

您对文章和公众号的大力支持与推广！

凯伊会不断输出更好的技术教程分享~~

凯伊需要您帮忙点击“在看”和“点赞”和“转发”。

本文链接：https://gpt-4o.net/chatgpt/425.html

相关文章

十个专属于ChatGPT 4o生图的优质提示词，10个专属ChatGPT 4o生图的优质AI绘画提示词
最近是不是被各种吉卜力风格AI图刷屏了？说实话，都快看吐了......但你知道吗,ChatGPT4o的图片生成能力可远不止这点皮毛！今天就跟大家分享10个超实用的生图玩法，手把手教学+案例展示，保...
ChatGpt资讯2025-04-0152ChatGPT 4o AI绘画提示词
地表上最强的多模态Gpt 4o ，一起实测看看他到底强在哪里？，实测最强多模态GPT-4o，地表最强AI究竟强在哪？
** ，OpenAI推出的GPT-4o被誉为目前地表最强的多模态AI模型，其核心优势在于真正融合了文本、图像、音频等多模态理解与生成能力，实现了更自然的人机交互，实测显示，GPT-4o在响应速度、跨...
ChatGpt资讯2025-04-0144多模态 GPT4o
免费开放！GPT-4o图像生成功能上线，网友实测效果炸裂！，GPT-4o图像生成功能免费开放！网友实测效果惊艳全网
OpenAI宣布免费开放GPT-4o的图像生成功能，引发用户狂欢，实测显示，新模型生成的图像细节精细、光影自然，无论是概念艺术、产品设计还是日常场景还原都展现出惊人效果，社交媒体上网友纷纷晒出“用文字...
ChatGpt资讯2025-04-0148GPT4o 图像生成
实测，GPT-4o原生图像生成，这下可以用嘴画图，GPT-4o实测，原生图像生成功能，用嘴画图时代已来！
OpenAI最新发布的GPT-4o模型原生支持图像生成功能，用户现在可以通过自然语言描述直接生成图片，实测表明，该功能对文字指令的理解准确，能快速生成符合要求的图像（如"戴着墨镜的柴犬程序员"等创意场...
ChatGpt资讯2025-04-0149GPT4o 图像生成
GPT-4o图像生成效果炸裂！创业请避开大厂的赛道，GPT-4o图像生成效果震撼！创业者如何避开大厂竞争赛道？
** ，GPT-4o的图像生成能力表现惊人，技术效果堪称“炸裂”，其高精度和创意输出为AI领域带来新的突破，进一步拉大了与竞品的差距，对于创业者而言，专家建议避免直接与大厂（如OpenAI、谷歌等）...
ChatGpt资讯2025-04-0147GPT4o 创业赛道

网友评论