歌放大招,AI搜索引擎來(lái)了,發(fā)布最強(qiáng)AI模型!發(fā)布會(huì)現(xiàn)場(chǎng):總共提了120次AI、視頻模型登場(chǎng)......
雖然被OpenAI搶在前面發(fā)布了重磅新品演示,但谷歌后發(fā)制人,做到了OpenAI還沒(méi)能做到的事,率先發(fā)布人工智能(AI)搜索引擎,捍衛(wèi)搜索領(lǐng)域的王者地位,同時(shí)對(duì)壘OpenAI新發(fā)布的旗艦?zāi)P虶PT-4o,以升級(jí)版的最強(qiáng)大AI模型Gemini迎戰(zhàn)。
從北京時(shí)間5月15日凌晨1點(diǎn)開(kāi)始,谷歌在山景城總部附近的海岸線圓形劇場(chǎng),召開(kāi)了長(zhǎng)達(dá)兩個(gè)小時(shí)的年度I/O開(kāi)發(fā)者大會(huì)Keynote演講。
與預(yù)期一致,谷歌的這場(chǎng)發(fā)布會(huì)基本都是在談AI、AI、AI、AI和AI。根據(jù)發(fā)布會(huì)最后的官方統(tǒng)計(jì),整場(chǎng)Keynote的演講稿里總共提了120次AI。
谷歌CEO Sundar Pichai表示,谷歌所有的工作都圍繞生成式AI模型Gemini來(lái)做,“我們希望每個(gè)人都能從Gemini所做的事中受益。”AI搜索正是Pichai提到的Gemini融入谷歌多種服務(wù)之一。
同時(shí)谷歌搜索也將具備多步驟推理能力,可以一次性處理帶有多個(gè)限制條件的長(zhǎng)問(wèn)題,并支持“拍視頻”搜索解決方案的新搜索形式。
另外以上下文窗口“長(zhǎng)”聞名的Gemini 1.5 Pro大模型,在今年晚些時(shí)候?qū)?huì)把100萬(wàn)Tokens的窗口,進(jìn)一步擴(kuò)大至200萬(wàn)Tokens,拓展同步處理多模態(tài)信息的邊界。而對(duì)于一些需要快速響應(yīng)的場(chǎng)景,谷歌也推出了Gemini 1.5 Flash模型。今年2月剛剛問(wèn)世的Gemma開(kāi)源模型,也將在下個(gè)月迎來(lái)參數(shù)量更大的Gemma 2。在多模態(tài)領(lǐng)域,谷歌也發(fā)布了文生圖工具Imagen 3、與Youtube&音樂(lè)家合作的“AI音樂(lè)沙盒”,以及最新的視頻生成模型Veo。而多模態(tài)Gemini Nano模型也將在今年晚些時(shí)候登陸Pixel手機(jī),這是在本地運(yùn)行的機(jī)載模型。
值得注意的是,谷歌的發(fā)布會(huì)上也有一些與昨日OpenAI發(fā)布會(huì)“雷同”的地方——實(shí)時(shí)AI助手。從今年夏天開(kāi)始,Gemini也將支持語(yǔ)音實(shí)時(shí)交互,同時(shí)今年晚些時(shí)候還將上線實(shí)時(shí)視頻交互。未來(lái)幾個(gè)月內(nèi),谷歌也將推出類(lèi)似于GPTs的自定義AI助手功能,叫做Gems,能夠與整套“谷歌全家桶”聯(lián)動(dòng)。
硬件方面,谷歌宣布了第六代TPU芯片Trillium,并透露能夠在明年初用上英偉達(dá)最新的Blackwell架構(gòu)GPU。另外,液冷、光纜等中國(guó)股民可能會(huì)感興趣的題材也在發(fā)布會(huì)上出現(xiàn)。
Gemini 1.5 Pro上下文窗口200萬(wàn)token
全球最長(zhǎng)
谷歌稱(chēng),推出號(hào)稱(chēng)有史以來(lái)最強(qiáng)大AI模型Gemini Advanced三個(gè)月內(nèi)。從本周二起,谷歌在Gemini Advanced中加入新模型成員Gemini 1.5 Pro,稱(chēng)它擁有的上下文窗口在全球消費(fèi)類(lèi)聊天機(jī)器人中最長(zhǎng),窗口起始就有100萬(wàn)個(gè)token。Gemini 1.5 Pro將向150 多個(gè)國(guó)家地區(qū)的Gemini Advanced訂閱者提供,支持超過(guò)35 種語(yǔ)言。
Pichai稱(chēng),Gemini 1.5 Pro“提供了迄今為止所有基礎(chǔ)模型中最長(zhǎng)的上下文窗口。” 他介紹,Gemini 1.5 Pro將擁有200 萬(wàn)個(gè)token的上下文窗口,是當(dāng)前模型100萬(wàn)個(gè)token窗口的兩倍。
Gemini新語(yǔ)音對(duì)話(huà)功能Live定制版Gemini
谷歌稱(chēng),今年夏季將擴(kuò)展 Gemini 的多模態(tài)功能,包括增加用語(yǔ)音進(jìn)行深入雙向?qū)υ?huà)的能力,該功能被稱(chēng)為 Live。通過(guò) Gemini Live,用戶(hù)可以與 Gemini 交談,并可以從各種自然的聲音中選擇它回應(yīng)的聲音。用戶(hù)甚至可以按照自己的節(jié)奏說(shuō)話(huà),或者在回答過(guò)程中打斷并澄清問(wèn)題,就像在任何人類(lèi)對(duì)話(huà)中一樣。

