5月11日消息,谷歌在其I/O大会上发布了最新的人工智能(AI)语言模型PaLM 2,该模型将与OpenAI的GPT-4等展开竞争。据谷歌DeepMind部门副总裁Zoubin Ghahramani表示,PaLM 2是目前最先进的语言模型之一,它可以进行数学、编码、推理、多语言翻译和自然语言生成。PaLM 2相较于上一代语言模型PaLM 1,具有更强的逻辑和推理能力,在理解、生成和翻译各种语言的细微文本(包括成语、诗歌和谜语)方面有了显著提高,现在可以理解100多种语言。
PaLM 2在发布前已经被用于支持谷歌自家的25项功能和产品,其中包括AI聊天机器人Bard、Gmail、谷歌Docs、谷歌Sheets和YouTube。此外,PaLM 2现在可以通过高级语言能力考试,且能达到“精通”的水平。谷歌首席执行官桑达尔·皮查伊(Sundar Picha)表示,PaLM 2模型在逻辑和推理方面更强,这要归功于广泛的逻辑和推理训练。
与此同时,PaLM 2的发布也是为了更好地应对OpenAI的新型AI聊天机器人工具ChatGPT的竞争。ChatGPT是OpenAI于去年11月推出的一款聊天机器人,具有快速生成文章、故事、歌词、散文、笑话以及代码的能力,并能回答各类疑问。据网络流量数据网站SimilarWeb统计,ChatGPT的全球访问量在4月份达到17.6亿次,超过了其他国际搜索引擎,达到谷歌的2%和百度的60%。OpenAI的ChatGPT的强大功能吸引了越来越多的关注,导致了主流对现代人工智能力量的兴趣激增。
据了解,PaLM 基于谷歌 Pathways 架构,第一个版本于2022年4月发布。而PaLM 2构建于谷歌最新 JAX 和 TPU v4 之上,改进了数学、代码、推理、多语言翻译和自然语言生成能力,利用谷歌最新的 TPU 算力基础设施提升了训练速度。谷歌称,由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务效率更高,整体表现更好。
PaLM 2 模型提供了不同规模的四个版本,从小到大依次为壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),更适于各种用例的部署,并在特定领域的数据上进行了微调,为企业客户执行某些任务。其中轻量级的 Gecko 模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行出色的交互式应用程序。
PaLM 2 在大量包含数学表达式的科学论文和网页上进行了训练,可以轻松解决数学难题、推理文本甚至可以输出图表。从基准测试上可以看到,对于具有思维链提示或自洽性的 MATH、GSM8K 和 MGSM 进行基准评估,PaLM 2 的部分结果超越了 GPT-4。
PaLM 2还改进了对代码编写和调试的支持,在 20 种编程语言上进行了训练,包括 Python 和 JavaScript 等流行语言以及 Prolog、Verilog 和 Fortran 等其他更专业的语言。在PaLM 2 的基础之上,谷歌构建了用于编码和调试的专用模型Codey,用于补全代码和生成服务。
总的来说,谷歌PaLM 2的发布证明了谷歌在人工智能领域的实力,该模型的强大功能将为企业客户执行各种任务提供有力的支持。尽管ChatGPT的强劲表现吸引了人们的注意力,谷歌正在努力发展更为先进的技术,以保持在人工智能领域的领先地位。