360隨身wifi3怎么樣(沒放PPT,360版的GPT怎么樣?我們把它和ChatGPT、文心一言比了比)
要說搜索引擎和生成式AI大模型絕配應該不會有人反對。
前有微軟bing+GPT,再有國內搜索頭號玩家百度推出文心一言,昨日國內搜索的二把手360也忍不住秀了自己的GPT類產品。
“把剛生出來的孩子抱出來看看”,360創始人周鴻祎也直言可能還存在不足,順便請網友幫產品取個名字。
直播間不少人敲出了“紅孩兒”,看著周鴻祎的紅色POLO衫就很應景。
而這次周鴻祎沒放PPT,甚至和主持人以及現場觀眾互動演示產品,先不說產品怎么樣,紅衣大叔確實勇氣可嘉。
那么360GPT到底效果咋樣呢?我們一起來回顧下,順便和ChatGPT、bing以及文心一言做個對比。
沒有PPT,周鴻祎現場演示
和ChatGPT、bing以及文心一言還有差距
360這次演示的產品有點像bing+GPT,360也是將AI大模型與360搜索結合在一起。
具體使用方法與bing類似,就是在搜索框輸入問題,然后會給出AI大模型生成的答案。
相比獨立的AI大模型產品,和搜索引擎結合后大模型的信息源會更新。
這次現場演示總共測試了7個問題,咱們先來看看360的輸出結果,后面也將和ChatGPT、文心一言以及bing作對比。
1、周鴻祎為什么老愛穿紅衣服?
360的答案還算OK,可以看到答案援引了新浪科技的報道。
筆者找到當時新浪科技的那篇報道,基本就是復制了當時的報道原文。
再來看看下面3位參賽選手的生成結果,從上到下依次是bing、ChatGPT、文心一言,后文排列順序也是如此。
測試下來其實只有bing說出了基于事實的正確答案,而ChatGPT、文心一言則是開啟了分析模式,雖然講的頭頭是道,但卻不是基于已有事實。
ChatGPT、文心一言的回答展示了AI大模型生成答案的通用模式,像是經過分析的理性答案。相比而言,360和bing都體現了與搜索引擎結合的優勢,能夠利用搜索引擎的海量數據。
2、周鴻祎為什么總愛聊GPT?
同樣的,360還是大比例地復制了經濟觀察網的報道原文。
而其他3個產品的答案更有加工因素,不像360會復制新聞,另外ChatGPT、文心一言比較喜歡長篇大論的分析,bing則比較簡短。但總體上看,3個回答都有一定的參考價值。
3、為什么要暫停訓練GPT5?
上述問題是昨日的新聞熱點,我們可以看到360其實也是大段引用了昨日的新聞報道,這再次體現了與搜索引擎結合的優勢。
而ChatGPT、文心一言都沒有給出準確回答,文心一言干脆擺爛,表示不清楚。ChatGPT則基于各種常識進行了一波分析,但如果拋開新聞本身來說,這些分析也有參考性。bing則再次和360一樣,得出了正確答案,甚至還貼出了新聞的相關鏈接。
4、卡塔爾世界杯冠軍是哪個國家?
這個問題比較簡單,不需要進行太復雜的判斷,其實考察了數據量的問題。360輕松回答正確。
但ChatGPT則因為數據庫最新的是2021年9月,所以沒有給出答案,文心一言和bing也都成功作答,所以百度的訓練數據還是比ChatGPT新的。
5、孫悟空大戰滅霸,誰會贏?
這個問題考察了AI的邏輯思考能力,這次360的回答就比較離譜。360認為孫悟空吊打滅霸,但理性判斷的話,二者并沒有可比性,況且答案的結論也沒有給出讓人信服的理由。
事實上,三言發現360的回答部分內容就直接復制了中國新聞社2019年的一篇文章。
而相比360的莽撞回答,另外3個回答就比較理性。bing和ChatGPT的回答如出一轍,均認為虛構角色沒辦法直接對比,結果取決于創作者的想象力。
文心一言則從技能、戰術等角度去分析二者的能力。
6、梅西在阿根廷國家隊進了多少球?
這個問題也是考察了對最新數據的收集和分析整理能力,不過這次360翻車了。
360回答了3次,都是100個球,但事實上梅西是102個球。而102球的數據是昨天才有的。
值得注意的是,一直表現不錯的bing這次也翻車了,顯示梅西共進了90個球。ChatGPT同樣是因為數據更新只到2021年9月,所以沒有最新數據,給了老數據。
不過,文心一言這次給出了正確答案。
7、會議臨近結束時,領導說我再講十分鐘,意味著什么?
這考察AI的語意理解能力,不過一開始360表現并不好。經過幾次嘗試,才最終理解了“領導想要占用更多時間”意思。
而在這次挑戰中,ChatGPT成功給出了正確答案,文心一言和bing都沒有理解正確。
經過對比測試,能夠看到360、bing和文心一言由于和搜索引擎掛鉤,所以在信息的實效性上表現較好。
不過360更傾向于復制信息原文,加工程度相比其他3家較低。
在邏輯理解、語意理解等能力上,ChatGPT是表現最好的,盡管它有時給出的回答并不是基于事實信息,但它的回答有邏輯性,大多數情況下都有參考價值。
相比而言,360更傾向于搜索新聞,但是沒有體現AI生成式大模型的智能型,答案不夠個性化,加工程度低。
360生成式AI還是個“寶寶”
買了船票還沒上船
在昨日演示中,周鴻祎表示,“GPT是場新工業革命,其意義超越了互聯網、iPhone的發明。”未來每個行業、企業、個人都會擁有定制化GPT。在場景化、工程化、產品化、商業化方面中國擁有優勢,有能力發展自己的人工智能大語言模型。但中國大語言模型距離GPT-4有兩到三年時間差距,需要更多的寬容和耐心。
周鴻祎還提出了360的AI發展策略:“兩翼齊飛”。具體就是先占領場景,再同步發力核心技術。
周鴻祎現場介紹了360大模型戰略在ToC、ToSME、ToG&B方面的商業化場景落地計劃。
在To C端,將推出新一代智能搜索引擎,并基于搜索場景推出人工智能個人助理類產品;在To SME端,將基于生成式大模型推出SaaS化垂直應用,如結合生成式AI的“蘇打辦公套件”和“企業即時通訊工具-推推”等,以解決中小微企業數字化轉型難題;在To G&To B端,360已將核心數字安全能力融入安全AI模型,計劃結合數字安全業務推出企業私有化AI服務,滿足客戶對私有知識、資產的索引需求。
周鴻祎還指出360發展大語言模型的三大優勢:數據獲取和清洗;人工知識訓練;場景。
而事實上,我們看到無論是bing、文心一言的背后都有搜索巨頭的支撐,360的優勢它們也有,而且更加強悍。
其實對于搜索引擎和生成式AI的組合,優勢很多都是共通的,關鍵還是要看算法和訓練量。
目前來看,ChatGPT和bing無疑是投入最多的,借助ChatGPT的能力bing的下載劇增。
據Data.ai數據,新版微軟必應2月發布后下載量躍升8倍,谷歌應用下載量下降2%;必應的頁面訪問量上升15.8%,谷歌的頁面訪問量降1%。
在國內,文心一言還處于內測階段,對普通用戶來說還很難接觸到,但起碼邁出了第一步。相比而言,360才剛剛買了船票,還不算正式上船。
作為國內搜索市場的一二號玩家,百度相比360有了先發優勢,百度在AI上積累也有目共睹。
兩家搜索巨頭都還是在探索之中,相比而言百度略有優勢,但距離成熟產品還有距離。
正如周鴻祎所說,“GPT還是一個寶寶”,不過中國GPT距世界的標準比國足短多了。