淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区
标题:
谷歌发布多模态直播API:解锁看听说,开启AI音视频交互新体验
[打印本页]
作者:
运营笑笑
时间:
2025-1-5 19:39
标题:
谷歌发布多模态直播API:解锁看听说,开启AI音视频交互新体验
IT之家 12 月 13 日消息,谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,
资助开辟职员开辟具有及时音频和视频流功能的应用步伐。
该 API 实现了低耽误、双向的文本、音频和视频交互,以音频和文本情势输出,带来更自然流通、犹如人类对话般的交互体验。用户可以随时打断模子,并通过共享摄像头输入或屏幕录像与其举行互动,就内容提问。
该模子的视频明白功能扩展了通讯模式,用户可以或许使用摄像头及时拍摄或共享桌面并提出相干标题。该 API 已经向开辟者开放,同时也向用户提供了一个多模态及时助手的演示应用。IT之家附上演示如下:
该 API 支持集成多种工具,开辟者只需一次 API 调用,即可完成复杂的用例。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
欢迎光临 淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区 (https://tao92.com/)
Powered by Discuz! X3.3