当前位置: 首页>资讯 >

谷歌最新 AI 大语言模型 PaLM2 数据量扩充 5 倍

来源: 叶紫网 | 时间: 2023-05-17 10:03:46 |

北京时间 5 月 17 日早间消息,谷歌上周发布的最新大语言模型使用的训练数据,几乎是 2022 年的上一代模型 5 倍。得益于此,该模型在编程、数学和创意写作方面表现更好。


(相关资料图)

谷歌是在其 I / O 开发者大会上发布最新通用大语言模型 PaLM2 的。内部文件显示,该模型采用了 3.6 万亿个令牌(token)进行训练。令牌指的是单词串,这是训练大语言模型的重要基础,因为这可以教给模型如何预测字符串中可能出现的下一个单词。

之前版本的 PaLM 发布于 2022 年,当时使用的令牌为 7800 亿个。

虽然谷歌很希望展示其人工智能技术的实力,以及嵌入搜索、电子邮件、字处理和电子表格后的效果,但该公司却不愿发布其训练数据的规模和其他细节。微软支持的 OpenAI 也对其最新的 GPT-4 大语言模型的细节信息保密。

这些公司表示,之所以不披露这些信息,是出于商业竞争考虑。谷歌和 OpenAI 都在努力吸引想要用聊天机器人代替传统搜索引擎,从而直接获取答案的用户。

但随着人工智能军备竞赛日趋白热化,相关研究人员也呼吁企业加大透明度。

自从发布 PaLM2 之后,谷歌一直表示新的模型比之前的大语言模型更小,这就意味着该公司的技术效率得以提升,但却可以完成更加复杂的任务。内部文件显示,PaLM2 基于 3400 亿个参数训练 —— 这项指标可以说明该模型的复杂程度。最初的 PaLM 则基于 5400 亿个参数训练。

目前,谷歌尚未对此置评。

谷歌在一篇关于 PaLM2 的博文中表示,该模型使用了一种名为“计算机优化扩张”的新技术。这就让大语言“更高效、整体性能更好,包括加快推理速度、减少参数调用和降低服务成本。”

在宣布 PaLM2 时,谷歌证实了此前的媒体报道,计该模型针对 100 种语言进行训练,可以执行更广泛的任务。它已经被用于 25 项功能和产品,包括该公司的实验性聊天机器人 Bard。按照从小到大的规模划分,该模型共有 4 种,分别是壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn)。

根据公开披露的信息,PaLM2 比现有的任何模型都更加强大。Facebook 在 2 月份宣布的的 LLaMA 大语言模型采用 1.4 万亿个令牌。OpenAI 上一次披露 GPT-3 的训练规模时表示,它当时基于 3000 亿个令牌。OpenAI 今年 3 月发布 GPT-4 时表示,它在许多专业测试中展示出“与人类媲美的表现”。

LaMDA 是谷歌两年前推出的一个对话型大语言模型,在今年 2 月还与 Bard 一同对外宣传。该模型基于 1.5 万亿个令牌训练。

随着新的人工智能应用快速进入主流,围绕底层技术的争议也越来越激烈。

谷歌高级研究科学家艾尔・迈赫迪・艾尔・麦哈麦迪(El Mahdi El Mhamdi)于今年 2 月辞职,主要原因就是人工智能技术缺乏透明度。本周二,OpenAI CEO 山姆・阿尔特曼(Sam Altman)出席美国国会针对隐私和技术举行的听证会,他也认为需要设立一套新的制度来应对人工智能的潜在问题。

“对于一种全新的技术,我们需要一套全新的框架。”阿尔特曼说,“当然,像我们这样的公司应当为我们推出的工具承担许多责任。”

关键词:

 

热文推荐

谷歌最新 AI 大语言模型 PaLM2 数据量扩充 5 倍

上周发布的最新大语言模型使用的训练数据,几乎是2022年的上一代模型5倍。得益于此,该模型在编程、数学和

2023-05-17

全球讯息:申万期货:PTA回归弱势基本面

伴随着自身供应的增加以及终端负反馈的持续,在累库压力以及纺织淡季背景下,随着基差的走弱,PTA将维持弱

2023-05-17

热议:迟到的毕业礼 奋进的人生路

迟到的毕业礼奋进的人生路---□湖北日报评论员程曼诗“我怕我没有机会,跟你说一声再见……”近日,武汉大

2023-05-17

【环球播资讯】埃塞俄比亚索马里州发生洪灾 已致45人死亡

埃塞俄比亚索马里州发生洪灾已致45人死亡---联合国人道主义事务协调厅15日发布报告称,截至5月12日,埃塞俄

2023-05-17

拯救红肖梨 天天速看

京郊怀柔,有个村子盛产红肖梨。去年秋天大丰收,饱满的果子缀满枝头,有些还没下树就被抢订一空。今年5月

2023-05-17

世界球精选!some音标怎么拼读_some音译

1、演唱:gary还是出去吹点风吧在谁也不会找的地方看起来有点悲伤又如何反正又不止你一人如此偶尔是lonelylon

2023-05-17

粤港澳大湾区眼科学高质量发展高峰论坛在深举行 新消息

5月13日,“粤港澳大湾区眼科学高质量发展高峰论坛”在深圳恒生医院举行。此次论坛由广东省自然医学研究会

2023-05-17

曼联开启队内年度最佳评选,B费:竞争很激烈,很多球员都配得上 全球今日讯

曼联开启队内年度最佳评选,B费:竞争很激烈,很多球员都配得上,曼联,奖杯,足总杯

2023-05-17

环球视讯!长隆野生动物园在哪儿_长隆野生动物园在哪里简介介绍

对于长隆野生动物园在哪里这个问题感兴趣的朋友应该很多,这个也是目前大家比较关注的问题,那么下面小好小

2023-05-16

全球短讯!硅料新秀,没吃肉先挨揍?假如硅料跌到7万……

硅料,真的有可能跌到7万吗?假设,万一跌到7万,行业将会是什么样的格局呢?

2023-05-16

最新:宁夏硒砂瓜产业协会

1、宁夏硒砂瓜产业协会,社会组织。2、2020年3月26日,宁夏社会组织管理局将宁夏硒砂瓜产业协会列入社会组织活

2023-05-16

世界新消息丨热҈热҈热҈ !今日最高气温35℃!受热后千万别这么做——

北京市气象台14日19时发布今年首个高温蓝色预警信号预计15日至16日本市平原大部分地区日最高气温将达35℃市

2023-05-16

森马服饰:感谢投资者对公司的关注。截至目前,公司无回购计划

森马服饰00256305月16日在投资者关系平台上答复了投资者关心的问题投资者公司空闲资金充足近期是否有考虑回

2023-05-16

全球快看:高温预警信号发布有何条件?35℃、37℃、40℃以上各是什么预警?

根据《气象灾害预警信号及防御指南》标准,日最高气温连续三天在35℃以上,将发布高温黄色预警信号,最高气

2023-05-16

小台灯的制作方法小学生_小台灯的制作方法

1、准备所需的UIV有机发光二极管照明面板。2、根据UIV有机发光二极管照明面板设计灯座尺寸。3、准备设计图

2023-05-16

世界最新:河北省作家刘建东大解获“十月文学奖”

河北省作家刘建东大解获“十月文学奖”

2023-05-16

贷款需要8个点手续费?谨防骗局!-天天快报

贷款需要8个点手续费?谨防骗局!,贷款,骗局,网银,中介,建设银行

2023-05-16

长荣股份董秘回复:公司致力于推动行业数字化、智能化转型,通过多年的布局和在行业内的深耕,目前已取得一定实效 当前资讯

长荣股份(300195)05月16日在投资者关系平台上答复了投资者关心的问题。

2023-05-16

环球关注:比亚迪于淄博新设汽车销售公司,经营范围含电池销售

企查查APP显示,近日,淄博盛世新景汽车销售有限公司成立,法定代表人为翟栋,注册资本100万元人民币,经营

2023-05-16

过生日说平安顺遂好吗(过生日说平安顺遂好吗怎么说)-观速讯

1、过生日可以说平安顺遂。平安顺遂是指平安、顺当、顺利、合乎心意、顺其自然成长,也指事情合乎人愿,进

2023-05-16