AI聊天机器人ChatGPT

ChatGPT能够理解输入信息的含义并输出内容，在一定程度上可以说具有和人脑一样的能力。ChatGPT在大量网友的疯狂测试中表现出各种惊人的能力，如流畅对答、写代码、写剧本、辩证分析问题、纠错等等，甚至让记者编辑、程序员等从业者都感受到了威胁，更不乏其将取代谷歌搜索引擎之说。一时间，ChatGPT被赋予很多意义，被认为是AI史上的一个里程碑。

2023年3月百度公司发布AI聊天软件文心一言，功能与AI聊天机器人ChatGPT类似，同样引起极大关注。

AI聊天机器人的一般原理

从广义上看，ChatGPT是文字模态的AIGC应用，负责生成自然语言，能够和使用者进行问答式对话。近期大火的AIGC（AI-generated content）和ChatGPT都属于这类模型，即生成式AI。

其他形式还包括AI写诗、AI作曲、AI绘画、AI换脸，甚至有人认为，游戏中导入图片生成模型的捏脸系统都是AIGC。相关热门应用也层出不穷，包括Stable Diffusion、QQ小世界AI画匠/异次元的我、盗梦师、玩句等。

其中，ChatGPT被称为AI里程碑式应用，它是明星公司Open AI在2020年推出的自然语言生成式模型——GPT 3的衍生产品。此前也不是没有这类应用，AI客服、聊天机器人、语音工作助手、小说衍生器等都属于此类。

但ChatGPT的智能化远远超出了这些前辈。与此前的模型相比，ChatGPT亮点主要包括：

（1）新增代码理解和生成能力，对输入的理解能力和包容度高，能在绝大部分知识领域给出专业回答。

（2）加入道德原则。即ChatGPT能够识别恶意信息，识别后拒绝给出有效回答。

（3）支持连续对话。ChatGPT具有记忆能力，提高了模型的交互体验。

ChatGPT是如何获得理解力的

这一过程离不开大模型、大数据、大算力。整体技术路线上，ChatGPT在效果强大的GPT 3.5大规模语言模型（LLM，Large Language Model）基础上，引入人工标注数据+强化学习来不断训练语言模型，主要目的是让GPT模型学会理解人类的命令指令的含义。

简单来说，就是基于优秀的机器学习算法和强劲的算力，通过海量的数据训练，让AI学会思考。Open AI在2020年从微软取得GPT 3的独家授权后，一直在Azure AI超算基础设施（由V100GPU组成的高带宽集群）上训练该模型，主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。

另外，AI需要利用大量的标注语料进行训练和学习，标注数据的数量和质量对于模型的输出结果至关重要，数据标注/ AI训练数据因此也被视作增量需求。

guxing 2023-03-13

AI聊天机器人ChatGPT

今日关注

热点你先知

值得收藏