联系我们

会员中心

首页 > AI资讯 > AI知识

AI写作神器

AI智能对话

AI智能对话系统

AI长篇写作

AI一键生成万字文档

AI智能视频

自动剪辑，自动发布视频

炎黄AI注册

免费获取体验账号

生成式AI—大语言模型是如何生成内容的？

AI知识· 2023-09-21 14:23:13

备受关注的大语言模型，核心是自然语言的理解与文本内容的生成，对于此，你是否好奇过它们究竟是如何理解自然语言并生成内容的，其工作原理又是什么呢?

要想了解这个，我们就不得不先跳出大语言模型的领域，来到机器翻译这里。传统的机器翻译方式，还是采用RNN 循环神经网络。

循环神经网络（RNN）是一种递归神经网络，以序列数据为输入，在序列的演进方向进行递归且所有节点(循环单元)按链式连接。

释义来源:文心一言

就“我画一幅画”这句话而言，它会先将其拆分为“我”、“画”、“一幅”、“画”四个词，然后递进式一个词一个词对这句话进行理解翻译，像是:

微信图片_20230809104207.jpg

然后输出:I have drawn a picture.

这种方式简单直接，但因为 RNN 自身的线性结构导致其无法对海量文本进行并行处理，运行缓慢，另外还会有“读到后面忘了前面”，使 RNN 在处理长序列时会出现梯度消失或爆炸的状况。

直到2017年，Google Brain 和 Groogle Research 合作发布了一篇名为《Attention Is All You Need》的论文，该论文为机器翻译处理提供了一个崭新的方式，同时起了一个与《变形金刚》相同的名字——Transformer。

Transformer 是一种神经网络，它通过跟踪序列数据中的关系来学习上下文并因此学习含义。该模型在2017年由 Google 提出，是迄今为止发明的最新和最强大的模型类别之一。

释义来源:文心一言

Transformer 能对海量文本进行并行处理，因为它使用的是一种特殊的机制，称为自注意力（self-attention）机制。就像我们在进行长阅读时，大脑会依靠注意力选择重点词进行关联，从而“略读”后对文章更好的理解，该机制的作用就是赋予AI这项能力。

self-attention 是一种注意力机制，它通过对输入序列进行线性变换，得到一个注意力权重分布，然后根据这个分布加权输入序列中的每个元素，得到最终的输出。

释义来源:文心一言

同样还是“请注意垃圾分类”这句话，同样是被分成“我”、“画”、“一幅”、“画”四个词，在 Transformer 中它们会经历输入、编码器（encoder）、解码器(decoder)、输出四个阶段。

微信图片_20230809104207.jpg

具体来看，当句子拆解后输入到编码器（encoder）中，编码器会先对每个词的生成一个初始表征，可简单理解为对每个词的初始判断，比如“画”是名词，也可以是动词。

然后，利用自注意力（self-attention）机制计算词与词之间的关联程度，可以理解为进行打分，比方第一个“画”与“我”的关联程度高就给打6分，第二个“画”与“一幅”的关联也高打8分，“我”与“一幅”没什么关联就打-2分。

微信图片_20230809104207.jpg

接着，根据打分对先前生成的初始表征进行加工，第一个“画”与“我”的关联程度高，那就可以降低表征中对名词词性的判断，提升动词词性的判断;第二个“画”与“一幅”的关联程度高，那就可以降低表征中对动词词性的判断，提升名词词性的判断。

最后，将加工过的表征输入到解码器（decoder），解码器(decoder)再根据对每个词的了解结合上下文，再输出翻译。在这期间，每个词与词之间都可以同时进行，大大提高了处理速率。

可这样的 Transformer 和大语言模型有什么关系呢?

大语言模型本就是指使用大量文本数据训练的深度学习模型，而 Transformer 正好能为大量文本数据训练提供足够的动力。另外，在加工过的表征输入到解码器（decoder）后，能依靠这些表征推断下一个词出现的概率，然后从左到右逐字生成内容，在这个过程中还会不断结合先前已生成的这个词共同推断。

微信图片_20230809104207.jpg

比如根据“一幅”、“画”这两个词推断出下一个词是“风格”的概率最大，再兼顾“一幅”、“画”与“风格”推断下下个词是“水墨”，以此类推再下下下个词，下下下下个词，这才有了我们看到的大语言模型的内容生成。

这也是为什么大家普遍认为，大语言模型的诞生起点，就是 Transformer。

那么，Transformer 中最关键的自注意力（self-attention）机制是如何知道“打多少分”的呢?

这是一套比较复杂的计算公式:

微信图片_20230809104207.jpg

作简单理解的话，可以想想数学课本上关于向量的知识，当两个向量 a 和 b 同向，a.b=lallb|;当 a 和 b 垂直，a.b=0;当 a 和 b 反向，a.b=-lallbl。

如果把这里的 a、b 两个向量，看作是“我”、“画”、“一幅”、“画”四个词当中的两个在空间中的投射，那 a 乘 b 的数值就是打分。

这个数值越大，两个向量的方向越趋于一致，就代表着两个词的关联程度大;
数值是0，那就是两个向量垂直，同理词之间就没有关联;
数值是负数，那两个向量就是相反，两个词不但没关联，还差距过大。

只是这是简单理解，在现实中还需要一套纷繁复杂的计算过程，并且还需要多次的重复，才能获取到更加准确的信息，确定每个词符合上下文语境的含义。

以上就是大语言模型的工作原理了，强大 Transformer 的实用性还不止于在自然语言处理领域，包括图像分类、物体检测和语音识别等计算机视觉和语音处理任务也都有它的身影，可以说 Transformer 就是是今年大模型井喷式爆发的关键。

当然，Transformer 再强也只是对输入的处理过程，要想生成式 AI 生成的内容更符合我们的需求，一个好的输入是重要前提，所以下一期我们就来聊聊什么是好的输入，Prompt 又是什么?

您可能关注: 生成式AI

AI论文写作一键生成万字原创论文只需5分钟

文章链接: http://youthcy.com/aizixun/566.html Chat gpt人工智能中文版在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表炎黄立场。

轻创AI智能客户管理系统是一款全面而高效的客户关系管理工具，专门设计用于帮助企业更好地管理他们的客户资源和业务关系。该系统结合了强大的客户关系管理功能与先进的智能化技术，旨在提升客户满意度和忠诚度，从而实现更高的业务效益。

扫码咨询

关注微博

立即咨询

上一篇科大讯飞星火大模型的应用场景

下一篇 AI科普：关于人工智能的35个知识点

相关推荐

定制化企业AI知识库如何搭建？

　人工智能时代，企业都需要一个高效的知识管理系统来整理和共享内部知识。而定制化企业AI知识库的构建，无疑是一个理想的选择。那么，该如何搭建一套定制化的企业AI知识 ...

chatGPT人工智能中文免费版

　人工智能在现代科技中扮演着越来越重要的角色，可以说已经深入到了我们的生活中。在这其中，chatGPT人工智能免费版则是一款非常实用的工具，它可以帮助我们更好地与人进行沟通。chatGPT人工智能免费版... ...

chat gbt人工智能在线对话

　人工智能chatgpt（chatgpt）是一种先进的人工智能技术，能够进行在线对话并提供智能化的问题解答和交流。chatgpt基于大规模的语言模型，通过深度学习算法训练而成，具备出色的语言处理能力和对... ...

马斯克发“擎天柱”机器人叠衣服视频动作虽慢但自然

　1月16日消息，当地时间周一特斯拉首席执行官埃隆·马斯克（Elon Musk）在社交媒体X上发布了公司人形机器人“擎天柱”（Optimus）叠衣服的演示视频，令人印象深刻。特斯拉最终希望人形机器人能够... ...

关于AI的20个冷知识，看看你知道多少

　小伙伴们，今天我给大家带来一些关于人工智能的冷知识，你肯定没听说过！快来看看吧！1. 人工智能并不是只存在于科幻电影中，它早已渗透到我们生活的方方面面。比如，你知道吗？现在很多网站上的客服都是“机器人... ...

怎么免费用Chat GPT人工智能

　CHATGPT是一款基于人工智能的聊天机器人，它可以与用户实时交流并回答各种问题。使用CHATGPT不仅方便快捷，而且可以节省很多时间和金钱。下面是一些如何免费使用CHATGPT的方法。1.聊天官网C... ...

专注于AI

懂企业管理，更懂CRM系统
0元下载体验

支持免费下载,0元体验
1对1技术支持

专属客户经理提供技术支持
炎黄咨询热线

13728822604

行业解决方案青年创业网新年祝福语