先锋影音资源人妻无码_久久国产精品亚色影院_亚洲av中文无码字幕色本_a级国产乱理伦片在线观

谷歌發(fā)布新一代大模型Gemini 2.0,備戰(zhàn)智能體時代

陳奇杰2024-12-12 22:51

經(jīng)濟觀察網(wǎng) 陳奇杰/文 12月12日,谷歌推出大模型Gemini 2.0?,谷歌CEO桑達爾·皮查伊(Sundar Pichai)稱,這是谷歌為新智能體時代構(gòu)建的下一代模型,也是谷歌迄今為止最強的大模型。

Gemini 2.0 Flash是谷歌此次發(fā)布的Gemini 2.0系列模型中的第一個模型。相比上一代模型Gemini 1.5 Flash,Gemini 2.0 Flash除了支持圖片、視頻和音頻等多模態(tài)輸入,還支持多模態(tài)輸出,例如其可以直接生成圖像與文本混合的內(nèi)容,以及原生生成可控的多語言文本轉(zhuǎn)語音(TTS)音頻。Gemini 2.0 Flash還可以原生調(diào)用谷歌搜索、代碼執(zhí)行以及第三方用戶定義的函數(shù)等工具。

皮查伊表示,如果說Gemini 1.0的作用是整合和理解信息,那么Gemini 2.0能夠做到讓信息更加有用。

基于Gemini 2.0模型,谷歌能夠構(gòu)建新的AI智能體,從而離構(gòu)建通用助手的愿景更進一步。智能體(Agent)是指能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的代理體,也被視為大模型落地的“最后一公里”。

過去一年里,谷歌持續(xù)開發(fā)了更多智能體模型。在發(fā)布Gemini 2.0的同時,谷歌也介紹了多個智能體。例如,Project Astra是通過多模態(tài)理解現(xiàn)實世界的智能體,它可以在多種語言和混合語言之間進行對話,能夠理解不同口音和生僻單詞,并以接近人類對話的延遲來理解語言。Project Astra最多可以記住長達10分鐘的會話內(nèi)容,并且可以回憶起過去與它進行的多輪對話,以便為用戶提供更好的個性化服務(wù)。Project Astra還能使用谷歌搜索、谷歌地圖等工具。?Project Astra被應(yīng)用于谷歌的AI助手Gemini app以及智能眼鏡等其他設(shè)備及產(chǎn)品中。

除此之外,谷歌還開發(fā)了可以幫助用戶完成復(fù)雜任務(wù)的智能體、面向開發(fā)者的智能體,以及面向游戲和其他領(lǐng)域的智能體。

在Gemini 2.0發(fā)布當(dāng)天,新加坡科研局資深科研工程師黃佳就體驗了該模型,并將其與OpenAI最新發(fā)布的o1模型進行對比。他的測試方式是提供一系列參考文檔,給出復(fù)雜邏輯,讓大模型進行自主編程,并提供詳細文案解釋。

黃佳表示,在一般情況下,ChatGPT o1的邏輯推理還是更強。具體而言,兩個模型都體現(xiàn)出了很強的分析推理能力,但ChatGPT o1可以接受的文檔輸入長度較長,Gemini 2.0會截斷部分太長的參考文檔;此外,ChatGPT o1給出的代碼,質(zhì)量較高,缺陷(bug)較少,ChatGPT o1的代碼解釋更詳盡,更接近黃佳想要的寫作風(fēng)格,Gemini 2.0的解釋文案較為簡略。

黃佳感覺到,雖然目前大模型仍不可能僅靠簡單的提示詞,就自主干活,滿足需求,還需要在人的驅(qū)動之下,在精準(zhǔn)的業(yè)務(wù)場景中,經(jīng)過設(shè)計、編程、整合等過程,才能夠成為智能體,但是大模型能力在進步,人們對大模型能力邊界的認(rèn)識也越來越清晰,這帶來了智能體發(fā)展的加速,周圍同事也在更多地用智能體做實際項目。

TMT新聞部記者
長期關(guān)注并報道TMT(科技、游戲等)領(lǐng)域重大事件,擅長人物專訪、行業(yè)分析報道。
郵箱:chenqijie@eeo.com.cn 微信號:Q1191278317

熱新聞

電子刊物

點擊進入