小语言模型 vs 大语言模型:生成式AI一定越大越好吗?

基于小语言模型的人工智能主要会运用于哪些场景? Source: Getty / Getty Images/piyaset
随着生成式人工智能在工作、学习和解决问题中的作用越来越大,了解不同类型语言模型之间的区别很有必要。
spk_0
您正在收听的是sbs广播中文普通话节目,更多节目内容请浏览sbs点com点au斜杠md或下载应用程序sbsradioapp。
SBS记者Jason Liu
随着人工智能在工作、学习和解决问题中的作用越来越大,了解不同类型语言模型之间的区别变得更重要了。大语言模型已被广泛使用。小语言模型也正变得越来越重要。小语言模型重要在哪里呢?我采访了悉尼科技大学数据科学研究所自然语言处理研究员Lin Tian博士。Tian博士您好!
SBS记者Jason Liu
Tian博士,我看到微软最近发布了一款可以直接在用户电脑上运行的小语言模型,英文缩写叫 SLM 哈,能首先请您给我们讲讲哈,什么是小语言模型吗?
悉尼科技大学数据科学研究所研究员Lin Tian博士
归根结底还是一个语言模型,它之所以为小,是因为主要是从它的本身的体积会比较小,也就是说它里面的运算的函数或需要的那个变量会比较的少,但是它归根结底还是一个语言模型。生成式人工智能这个模型本身它是有一个根据你现有的信息,然后给你生成,如果是用语言来讲的话,是生成下一个词。大家基本上现在我们在用的,比如说像 ChatGPT 啊,这种就是更多的是说基于生成式的这个能力,然后我们做了一个大语言模型。
SBS记者Jason Liu
大语言模型就是几乎就是把过往的网络上能找到的内容,或者是它自己输入的这个培训的内容、训练的内容全放进去,同时呢,还搜索能搜到的这些所有的网络内容而生成的一些内容。
悉尼科技大学数据科学研究所研究员Lin Tian博士
对,是这样的。
SBS记者Jason Liu
小语言模型呢?
悉尼科技大学数据科学研究所研究员Lin Tian博士
小语言模型其实它之所以是小,它就是说它的体积会比较的小,但是它的训练模式跟大语言模型其实是一样的。现在我们看到的很多的小语言模型,它是基于有一个技术是叫蒸馏,它就是说它基于大语言模型,然后它把它所需要的知识变得更精确一点的话,它变成一个相对比较小体积的一个语言模型,啊从而会叫成小语言模型。
SBS记者Jason Liu
还有哪些比较主要的区别吗?
悉尼科技大学数据科学研究所研究员Lin Tian博士
如果从能源消耗来讲的话,那小语言模型是非常的小的。然后再就是如果是从语言模型的部署来讲的话,啊小语言模型是可以,比如说在我们的手机上呀,或者是在我们的自动驾驶的车上呀,都是可以直接来应用的。而且小语言模型的话,它不需要就是有网络的连接,然后来体验到这种就是人工智能所谓的可以带给你的好处吧。呃,大语言模型的话,就像我们你要用 ChatGPT,那你首先是要连上网络,然后才去可以用 ChatGPT。呃,再就是还有一个呃,不同就是小语言模型相对于说,他会给你的反馈的时间会相对比较快一些,但是小语言模型同时也是缺点,就是说它不会像是大语言模型一样,它可以跟你聊,比如说聊很久,可以完成的任务会是相对比较简单一点的。另外一个最大的区别是,相对于大语言模型来讲,小语言模型的思考,但并不是真正的思考,就是它的推理能力会没有大语言模型强。
SBS记者Jason Liu
您自己是如何选择这个小语言模型和大语言模型的运用的呢?
悉尼科技大学数据科学研究所研究员Lin Tian博士
现在这两者的存在就是并不是说你一定要选择其中一个,就是同时还有第三个选择,就是说你可以各取所需,就是比如说大语言模型,它的思考能力,或者它处理复杂并且需要多个步骤的任务的能力会比较的强。那小语言模型的话,它会在一个特定的任务上会比较的好。那我现在在做的实验是更多的是把两者的结合在一起,就是说当我已经非常清晰地知道我的下一个任务是什么的时候,我会调用我的小语言模型。但是当我还在一个任务的初期,我并我需要部署每个任务的时候,我会调用大语言模型。这两个东西更多的是取决于你本身你的任务的复杂程度。
SBS记者Jason Liu
刚才您说这个小语言模型不需要联网哈,给我感觉安全性要比这个大语言模型安全特别多,可以这么理解吗?
悉尼科技大学数据科学研究所研究员Lin Tian博士
啊可以这么理解,就是说比如说像我们现实生活中很多,比如说在处理医疗事情的时候,我们并不希望去泄露病人的任何的隐私,那这种情况下,我们只有可以选择小语言模型去做这些任务,而并不是说欸我们啊,问一下 ChatGPT 应该怎么办,这样的话就我们就会泄露隐私。所以说小语言模型在隐私的保护上是啊远远高于大语言模型的。
SBS记者Jason Liu
小语言模型它的一个应用场景,主要会在哪些场景上去运用呢?
悉尼科技大学数据科学研究所研究员Lin Tian博士
我觉得小语言模型,比如说它像我们的手机,比如说我会把我每天的行程放在我的手机上,但我并不希望去泄露这些东西,这是我个人的隐私。那这种情况下就是一个非常好的一个应用场景。那同时也像我刚刚说过的,我觉得在这种边缘计算上,特别是自动驾驶的车上面,我觉得小语言模型的优势还是挺大的,也是一个很广泛的应用场景。比如说如果是在图书馆的场景里面,我已经知道所有的书的编码了,那我去找我想要的书,那我其实相对于大语言模型来讲的话,小语言模型在这个方面会更好一些。就是当你非常确定你想要做的一个非常小的一个 task,非常小的一个任务的时候,那么它会是比较好的。
SBS记者Jason Liu
在您看来哈,随着这个用户越来越多,它的语言模型可能会越来越完善哈,这个生成式人工智能还不会不会有这个比方说比较大的一个质的一个提高呢?质的飞跃。
悉尼科技大学数据科学研究所研究员Lin Tian博士
我还是相信会有的。现在的语言生成式人工智能的话,它跟人的区别是,最大的区别我会觉得是在一个啊逻辑思考能力上。但是如果一旦这个突破了,比如说像我们现在有很多的视觉模型或视觉大语言模型,那这种情况下,就是当这个模型它真的可以看到这些事情,或者是就不仅在文字上面的时候,我觉得它的推理能力也会逐渐地被提高。就像现在刚刚结束的一个人工智能方面,一个比较好的会议上,很大的部分的文章会是在研究说,欸那我们怎么会让模型会有更多的思考能力,我觉得还是会有一个很大的突破。
SBS记者Jason Liu
非常感谢Tian博士的分享和介绍。
















