- 业界 2024-05-15 11:37

谷歌 i/o开发者大会汇总:ai模型全面更新 几乎覆盖所有生成模型类型-凯发游戏

站长之家(chinaz.com)5月15日 消息:在昨晚的google i/o发布会上,google宣布了一系列的更新,涵盖了从文本到视觉和音乐的多个领域:

1.5pro:支持200万上下文,针对翻译、编码、推理等关键用例进行了质量改进,但未发布测试结果。

gemini flash:针对响应速度至关重要的窄或高频任务进行了优化,价格比gpt-3.5更便宜。

image.png

gemini模型家族:

  • ultra:最大的模型,仅在gemini advanced提供。
  • pro:最佳总体性能模型,api预览版中提供。
  • flash:轻量级速度/效率模型,api预览版中提供。
  • nano:设备上模型,将内置于chrome126中。
  • gemini gems:谷歌的gpts,支持自定义与gemini的互动方式。
  • gemini live:基于声音的深入双向对话能力,project astra实时视频理解个人助理聊天机器人即基于此。
  • gemma2:6月发布,规模为27b,以更小的尺寸提供接近llama-3-70b的性能。
  • paligemma:谷歌的第一个视觉语言开放模型,灵感来自pali-3。
  • veo:deepmind开发的模型,旨在对标sora,但一些体验者认为效果不尽人意。
  • imagen3:图像模型,能够理解自然书写的提示,生成高质量逼真图像,并在渲染文本方面表现优异。
  • music ai sandbox:旨在改变音乐创作方式的ai工具,用户可以全新创作乐器部分,轻松转换不同曲目风格。
  • trillium:谷歌最新的tpus,计算性能比上一代tpu v5e提升高达4.7倍。

这次发布会展示了google在ai领域的全面布局和创新能力,从文本到视觉再到音乐,google的ai模型正在不断进步,为用户带来更加丰富和高效的体验。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看

网站地图