來源:智東西
發(fā)布時間:2024-12-9
閱讀量:14
大模型已經(jīng)展現(xiàn)出對智能裝備“點石成金”的功效。
狂飆500多天后,國內(nèi)的“百模大戰(zhàn)”正進入落地驗證期。當下,行業(yè)和產(chǎn)業(yè)對大模型的期待,正從“你家大模型有多強?”變?yōu)椤澳愕拇竽P湍軒臀腋墒裁??”?/span>
10月22日-10月25日,2024中國國際社會公共安全產(chǎn)品博覽會(簡稱:2024安博會)在北京舉辦。作為多年來AI產(chǎn)業(yè)發(fā)展的一大風向標,這場盛會被產(chǎn)業(yè)人士寄托的使命之一正是回答上述問題。而這,也是AIoT頭部企業(yè)宇視科技在做的事。
今年安博會上,宇視科技的展臺成為人氣最高展臺之一。通過五大展區(qū)近百個展出單元,宇視亮出了AI大模型落地的實戰(zhàn)成果和作戰(zhàn)圖譜。
▲宇視展臺現(xiàn)場人頭攢動
像百度搜索一樣檢索視頻內(nèi)容的“萬物搜”、夜視能力倍增的AI-ISP獵光系列夜視攝像機、能跟用戶互動的AI體育鍛煉屏、助智慧城市治理降本增效的大模型方案……今年宇視已不限于大模型相關(guān)部件產(chǎn)品展示,而是實現(xiàn)從軟件、裝備到行業(yè)方案全覆蓋。
2023年5月,宇視推出AIoT行業(yè)大模型“梧桐”,今年4月升級為“梧桐2.0”版本,多模態(tài)及推理能力進一步升級,目前已經(jīng)衍生和優(yōu)化了上千種相關(guān)AI算法,落地城市、交通、文娛、教育等超十個行業(yè)。
▲宇視展臺現(xiàn)場展出的梧桐2.0架構(gòu)圖
當下,AI亟需完成一次新的價值自證和他證。To C消費類AI大模型產(chǎn)品的流量高峰已被瓜分一波,第二波機會來到了與實體經(jīng)濟息息相關(guān)的To B數(shù)字化轉(zhuǎn)型市場。透過宇視科技本次安博會的展出,回溯其在數(shù)字化轉(zhuǎn)型中的“探?!敝?,我們可以看到,大模型的底座價值正如何一步步潛入千行百業(yè),轉(zhuǎn)化為新質(zhì)生產(chǎn)力。
01.智能升級:基于梧桐2.0的“萬物搜”來了
今年安博會,要說最引人關(guān)注的AI大模型新應用是什么?可能不是各家都在做的智能聊天機器人,也不是爆火的AI視頻生成工具,而是這款名為“萬物搜”的視頻搜索“神器”。在宇視中心區(qū)域展區(qū),一塊大屏幕前,圍滿了視頻數(shù)據(jù)服務系統(tǒng)“萬物搜”的體驗者。他們只需要輸入文字描述,就能從現(xiàn)場實時視頻內(nèi)容中,快速檢索出貼近意圖的結(jié)果。比如搜索“拉行李箱的人”,“萬物搜”就會立刻識別并輸出對應的結(jié)果。
▲“萬物搜”被許多觀眾圍觀體驗
即便是一些十分小眾的情況,“萬物搜”也可以通過深度解析和語義理解,搜索到用戶所需內(nèi)容。比如搜索“帶狗頭頭套的人”這樣語義更具體的描述,“萬物搜”也能準確地識別并找到。
▲“萬物搜”現(xiàn)場體驗
當輸入“一個舉著手機拍照的年輕男士”這種多個任意元素組合的提示詞,“萬物搜”也能立刻識別出來貼合表述的視頻內(nèi)容。
▲“萬物搜”現(xiàn)場體驗
這一應用具有很強的應用價值,比如可用于失物招領(lǐng)。在一個智慧園區(qū)場景,某業(yè)主購買了一份麥當勞外賣丟失了,他只需要借助“萬物搜”去搜索“拿麥當勞外賣的人”,就可以查詢到相關(guān)的視頻記錄,從而尋回失物。宇視相關(guān)負責人鄭勇告訴智東西,“萬物搜”基于多模態(tài)大模型算法開發(fā)。相比于傳統(tǒng)小模型時代的CV識別車牌、衣著等部分有限特征,“萬物搜”的搜索對象的邊界得到了極大擴展,從而使行業(yè)價值也得到大幅提升。究其背后主要的技術(shù)難點,還是多模態(tài)融合。
據(jù)悉,“萬物搜”基于宇視自研行業(yè)大模型“梧桐2.0”,融合自然語言處理、視頻特征提取和語音識別多種能力,深度理解分析輸入文本、語音或圖片,及其上下文語境關(guān)系,從而讓用戶可以準確搜索到所需的大部分視頻內(nèi)容?!拔嗤?.0”是一個覆蓋了圖像編解碼、計算機視覺、自然語言處理、多模態(tài)等多個領(lǐng)域的AIoT行業(yè)大模型。根據(jù)宇視官方數(shù)據(jù),其已經(jīng)基于“梧桐2.0”大模型面向十個行業(yè)推出了近千種長尾算法。與此同時,其在這十大行業(yè)“梧桐2.0”均已有產(chǎn)品出貨和項目實際落地。
“從業(yè)者會有一個很直觀的感受,越來越多的長尾算法的需求都能得到響應,行業(yè)對于視頻能力的期待也因大模型提高了?!编嵱抡f??梢钥吹剑珹I大模型已經(jīng)催生了一大批智能功能和行業(yè)算法,呈現(xiàn)出落地可用的效果。而這,只是AI價值自證的一個開始。這些智能功能還需要在城市管理、交通治理、園區(qū)運營等各行各業(yè)的場景中廣泛應用,才能真正發(fā)揮出行業(yè)價值。
02.裝備進化:把大模型“塞進”攝像機
在大模型進入行業(yè)之前,有一個重要中間環(huán)節(jié)不容忽略,那就是“裝備大模型化”。當下,我們看到微軟正在將大模型“塞進”電腦,華為、蘋果等手機廠商正將大模型“塞進”手機。而以宇視為代表的AIoT頭部企業(yè),也正將大模型“塞進”攝像機。
大模型正催生新的裝備進化——本次,在宇視展臺上備受關(guān)注的AI-ISP獵光系列智能攝像機就是一大代表。基于大模型打造的“獵光2.0-AI-ISP”圖像引擎,可以使得前端攝像機應對多種極黑、無光、微光場景挑戰(zhàn)。在現(xiàn)場設置的暗室中,一臺僅僅數(shù)百元的經(jīng)濟型攝像機,即使是在低至令人難以置信的≤0.0001 Lux的照度環(huán)境下,依然能夠讓圖像呈現(xiàn)出如同在白晝中一般的鮮艷色彩。
▲AI-ISP獵光系列智能攝像機效果展示
大模型+智能攝像機設備,讓過去AIoT行業(yè)難以解決的痛點迎刃而解。眾所周知,夜間是安全隱患的高發(fā)時段。由于光線不足,人類視覺難以清晰地觀察到周圍的環(huán)境,往往使得安全隱患難以察覺,星光等夜視攝像機的出現(xiàn)大大緩解了這一問題。但具有高品質(zhì)成像效果的傳統(tǒng)夜視攝像機成本較高,在方案部署的時候容易被戰(zhàn)略性舍棄。缺少高性價比的夜視攝像機,這是行業(yè)的一大痛點。
宇視AI-ISP獵光系列智能攝像機直擊這一痛點。鄭勇告訴智東西,基于“梧桐2.0”,攝像機算法在訓練的過程中,可以采用由AI生成的大量不同場景的視頻素材,例如微光的魚塘、無光的鄉(xiāng)村小路等,從而大大壓縮了訓練成本。
同時,基于數(shù)千種場景的實驗訓練及測試,AI-ISP獵光系列智能攝像機算法快速迭代,強化拖影收斂、動態(tài)降噪、場景提亮、色彩還原、對比度增強效果,使圖像質(zhì)量突破傳統(tǒng)ISP極限。可以看到,大模型已經(jīng)展現(xiàn)出對裝備“點石成金”的效果。而這只是“裝備大模型化”眾多例子中的一個。
今年4月,宇視提出“把所有裝備用大模型重做一遍”的理念,隨即推出了一大批“裝備大模型化”產(chǎn)品,覆蓋了AI端側(cè)裝備、AI邊緣端裝備、AI邊緣域裝備全業(yè)務場景。在這三大場景中,除了AI-ISP獵光系列智能攝像機,大模型改造的設備還涉及AI體測一體機、室內(nèi)AI體鍛屏、視頻智能推訓一體機、視頻數(shù)據(jù)服務一體機等多種硬件,都實現(xiàn)了不同程度的數(shù)倍效果提升。
▲獵光2.0家族
做“裝備大模型化”的難點是什么?鄭勇告訴智東西,不同于手機、PC等設備大模型化,AIoT設備在屬于相對弱交互但高專業(yè)度的領(lǐng)域,這就需要在大模型、AIoT及行業(yè)中都有深耕的業(yè)務團隊來進行支持開發(fā),這也成為宇視做這件事的一大優(yōu)勢。
宇視正通過軟件硬件化、硬件裝備化、裝備序列化等一系列創(chuàng)新研發(fā),為全行業(yè)帶來“裝備大模型化”產(chǎn)品底座開放能力的質(zhì)變。
當下,無論是面向消費者市場還是企業(yè)級市場,裝備大模型化已經(jīng)成為行業(yè)發(fā)展的必然趨勢。而從企業(yè)級數(shù)字化轉(zhuǎn)型市場來看,我國ICT裝備門類眾多、產(chǎn)品強大而豐富。這些裝備更是大模型落地的重要載體,是大模型落地實體物理世界、釋放千行百業(yè)新質(zhì)生產(chǎn)力的重要抓手。
03.行業(yè)破圈:AI技術(shù)的一次自證與他證
大模型帶來了智能功能和裝備的進化,最終的效果還要在行業(yè)中驗證。作為一家AIoT產(chǎn)品方案及能力提供商,宇視在視圖領(lǐng)域有著多年的沉淀積累,致力于在智慧城市、交通、電力、企業(yè)園區(qū)等多個場景領(lǐng)域進行視圖價值賦能。如今這些行業(yè)經(jīng)驗,也正幫助其大模型加速在行業(yè)落地。
在本次安博會上,我們可以看到基于“梧桐2.0”的智能功能、裝備已經(jīng)落地到了文體娛樂、智慧城市、智慧交通、生態(tài)保護等各個領(lǐng)域。以宇視在現(xiàn)場展示的AI體育方案為例,基于梧桐大模型的AI體育鍛煉屏可以讓很多人站在同一個屏幕前一起做運動,記錄他們的動作細節(jié)和成績,為其自動打分并提供鍛煉建議。這不僅可以幫助校園開展運動、教學,也為社區(qū)鍛煉等更多場景提供了可能性。
▲AI體育解決方案展示
鄭勇透露,自梧桐大模型推出以來,宇視科技發(fā)力文教體領(lǐng)域,推出了AI體鍛屏、AI跑步屏、AI足球、旅拍兔VLOG、VR導游產(chǎn)品等多個創(chuàng)新解決方案,已快速落地全國百余個城市。在剛剛結(jié)束的“2024吳鉤足球全國總決賽”中,直播正是由宇視的AI全景相機進行智能導播。在支持多視頻拼接畫面自動矯正消除畫面畸變的同時,其基于AI畫面矯正及運鏡算法,讓攝像機進行自動檢測控球權(quán)、自動運鏡跟蹤,從而讓AI像人一樣去進行精彩賽事直播?;谟钜暋拔嗤?.0”打造的解決方案,也同時落地到了智慧城市治理、智慧人行、智慧車行、動物保護等各個領(lǐng)域。
在某地的智慧城市治理中,相關(guān)部門應用了基于“梧桐2.0”的城市解決方案,聚焦群眾關(guān)注的民生問題比如廣場舞噪音管理、社區(qū)及城市的衛(wèi)生管理等問題,使其得到高效解決,12345投訴量下降60%。在這類場景中,各種細碎的問題都可以找到個性化長尾算法,比如:噪音傳感器加視頻聯(lián)動,解決工地超時施工擾民難題;物聯(lián)網(wǎng)油箱蓋加車載攝像機,解決危險駕駛隱患和油耗異常等。這些行業(yè)解決方案,都不同程度地助力提升管理效率,減少安全隱患。大模型為各個行業(yè)的數(shù)字化轉(zhuǎn)型帶來了真實價值,也為各個行業(yè)的從業(yè)者帶來更多機會和商機。這不僅是宇視AI技術(shù)的一次自證,也是其與集成商、渠道商伙伴開啟的一次他證。
在去年6月的北京安博會現(xiàn)場,宇視啟動了梧桐大模型種子合作伙伴計劃,與來自交通、教育、零售、體育公共服務等領(lǐng)域的多位伙伴合作開啟共創(chuàng)。宇視提供軟件技術(shù)賦能平臺,推出了集數(shù)據(jù)管理、模型管理、服務管理、快捷工具于一體的行業(yè)大模型生態(tài)服務平臺;行業(yè)伙伴基于宇視平臺和協(xié)助,進行解決方案的開發(fā)和推廣。
時隔一年多,鄭勇告訴智東西,一些合作比較深入的伙伴已經(jīng)能夠收益。他們通過宇視推訓一體機去訓練行業(yè)自有模型,將產(chǎn)品和方案銷售給同行或終端用戶,還能進行二次收益??梢钥吹?,當集成商、渠道商從“搬箱子”的人變?yōu)橹悄芑桨缸稍兎丈蹋c上游設備商的關(guān)系由買賣變?yōu)榕嘤凸矂?chuàng)關(guān)系,AI技術(shù)的自證與他證也正在接近完成時。生態(tài)賦能是一個長期過程。
當下,仍然有一些生態(tài)伙伴抱有慣性思維,希望買回一臺機器就擁有了大模型能力,因此在初始階段存在開發(fā)上手難的問題。對此,宇視會直接跟進和協(xié)助伙伴項目,保障項目看到效果;同時打磨設備,以開發(fā)出讓伙伴更易上手的平臺工具。可以預測,AI大模型帶來的將是整個行業(yè)數(shù)字化生態(tài)的變革。AIoT硬件市場或許會進一步向頭部集中,但算法、軟件、解決方案的能力將更多向集成商、渠道商靠近,從而形成新的行業(yè)秩序。
04.結(jié)語:宇視之路,AIoT行業(yè)之變
當全球大模型技術(shù)產(chǎn)業(yè)競賽加劇,中國企業(yè)與大模型技術(shù),正以更快的速度和千行百業(yè)搭起橋梁,落地見效。宇視科技圍繞“裝備大模型化”的探索之路,也正印證了中國AIoT行業(yè)之變。獨行快,眾行遠。裝備大模型化及產(chǎn)業(yè)落地前景遠大,但道阻且長,這是一條必須有伙伴同行的路。我們看到,產(chǎn)業(yè)鏈上的不少玩家已經(jīng)在轉(zhuǎn)換角色和思路,融入全新的生態(tài)共融秩序。AI技術(shù)的自證與他證仍在進行中,宇視和他的伙伴們將一起合力推動新業(yè)態(tài)的形成。
微信掃碼分享