看到有個(gè)搞工業(yè)視覺大模型的程序員在那吹,說自己公司所使用的工業(yè)視覺大模型都是經(jīng)過百萬、千萬甚至是上億數(shù)據(jù)訓(xùn)練的,識(shí)別準(zhǔn)確率超過99.3%,我看了笑了笑,別說99.3%了,就算是99.8%,在我們公司都是不合格的!
而他另一套純技術(shù)思維的說法就更讓我無語了,說什么:“準(zhǔn)確率高的,大概率都是小模型!”
咱拋開使用場(chǎng)景,只看訓(xùn)練的數(shù)據(jù)集,不看準(zhǔn)確率,這不是妥妥得耍流氓嘛!況且,工業(yè)視覺基本上都是非標(biāo)視覺,恰恰是很看使用場(chǎng)景的東西,所以,為什么很多大的工業(yè)視覺項(xiàng)目都看不到通用工業(yè)視覺大模型的身影?是我們做不出來嗎?是那套通用視覺大模型沒用,或者準(zhǔn)確率不高,好吧!
的確,現(xiàn)在工業(yè)視覺行業(yè)內(nèi)有很多通用型產(chǎn)品,比如說檢個(gè)小螺絲,貼個(gè)標(biāo)簽什么的,這都是簡單的工業(yè)視覺場(chǎng)景,遇到復(fù)雜的檢測(cè)場(chǎng)景,即使是上億數(shù)據(jù)集的工業(yè)視覺大模型,它也得針對(duì)單個(gè)場(chǎng)景單獨(dú)訓(xùn)練,該花多長時(shí)間就得花多長時(shí)間,本來應(yīng)該訓(xùn)練多少數(shù)據(jù)集,它就應(yīng)該訓(xùn)練多少數(shù)據(jù)集!
比如說,你是上億級(jí)工業(yè)視覺大模型,我是從0開始訓(xùn)練的工業(yè)視覺大模型,甲方生產(chǎn)時(shí)需要檢測(cè)一個(gè)叫作“螺母”的東西,那大概率是上億級(jí)的工業(yè)視覺大模型省時(shí)間,前提是它訓(xùn)練過“螺母”這個(gè)東西,如果沒有,那其實(shí)它和我這個(gè)從0開始訓(xùn)練的大模型其實(shí)是一樣的!我需要訓(xùn)練幾十萬次,那它同樣也得訓(xùn)練幾十萬次,沒有什么捷徑可走。
這時(shí)候,如果我訓(xùn)練后的準(zhǔn)確率控制在99.8%以上,而這個(gè)號(hào)稱用了上億數(shù)據(jù)集訓(xùn)練的工業(yè)大模型的識(shí)別準(zhǔn)確率最高只有99.3%,您認(rèn)為客戶會(huì)使用哪個(gè)?您跟他吹自己上億數(shù)據(jù)集,他不需要又有什么用?
對(duì)于客戶來說,拋開“螺母”這個(gè)東西,其他的訓(xùn)練對(duì)他都沒用,在代碼的世界里,我們管這個(gè)叫作“冗余”!
換個(gè)角度說,別說99.3%了,哪怕是99.9%,工業(yè)視覺項(xiàng)目能順利通過驗(yàn)收都是很難的,因?yàn)榭蛻粢?,其?shí)是100%!但是,大家都知道,只要是視覺,不管是工業(yè)視覺還是消費(fèi)市場(chǎng)的視覺,沒有誰能夠保證檢測(cè)100%的準(zhǔn)確率。
我做過的幾乎所有工業(yè)視覺項(xiàng)目,基本上合同上寫的識(shí)別準(zhǔn)確率就沒有低于千分之一的即99.9%,最夸張的一次,客戶直接要求識(shí)別準(zhǔn)確率要在萬分之一即99.99%,這個(gè)項(xiàng)目四年了,還沒有通過驗(yàn)收!我想未來只要客戶堅(jiān)持這個(gè)數(shù)字,估計(jì)大概率也是驗(yàn)收不掉了!
所以,工業(yè)視覺模型數(shù)據(jù)集大小其實(shí)并不重要,客戶看的,只是能給他節(jié)省多少事,客戶的要求其實(shí)就是替代人工或者極少數(shù)的人工干預(yù)。
假設(shè)甲方是一個(gè)生產(chǎn)螺絲的工廠,引進(jìn)了一臺(tái)視覺設(shè)備,檢測(cè)準(zhǔn)確率這里假設(shè)是90%,要求很低,對(duì)于生產(chǎn)的螺絲,只要檢測(cè)不合格,直接吹走或者推到瑕疵品區(qū)域即可,只要瑕疵品區(qū)域足夠大,即使是識(shí)別準(zhǔn)確率不高,那么產(chǎn)線在完全沒有人工干預(yù)的情況下,跑個(gè)個(gè)把小時(shí)甚至是一天都沒有問題。
但是,如果甲方是一個(gè)生產(chǎn)輪胎的工廠呢?同樣是90%的話,意味著每生產(chǎn)10個(gè)輪胎就有一個(gè)輪胎檢測(cè)不到,那視覺設(shè)備基本上就離不開人工了!
那假設(shè)如果我們的視覺設(shè)備能夠把識(shí)別準(zhǔn)確率提高到99.9%呢?對(duì)于生產(chǎn)螺絲的企業(yè)來說,其實(shí)影響不大,因?yàn)榧词故?0%,人工干預(yù)的情況也很少,但是,對(duì)于生產(chǎn)輪胎的企業(yè)來說,作用就大了,假設(shè)3分鐘檢測(cè)一個(gè)輪胎,那么原來90%的識(shí)別率,每30分鐘就得人工干預(yù)一下,現(xiàn)在變成了2天!
所以,拋開使用場(chǎng)景光談模型數(shù)據(jù)集大小那就是本末倒置!工業(yè)視覺的本其實(shí)就是準(zhǔn)確率,而不是所謂的通用性!
結(jié)語
為什么現(xiàn)在很多通用型的工業(yè)視覺軟件產(chǎn)品價(jià)格卷到了幾乎沒利潤,很多價(jià)格都卷到了千元以內(nèi),原因也是在這,過分講究模型的多樣性,實(shí)際上看似訓(xùn)練的數(shù)據(jù)集很大,但是解決不了客戶的實(shí)際問題,自然賣不動(dòng)!不管工業(yè)視覺產(chǎn)品怎么吹上天,終究還是以解決客戶問題為主,你解決不了客戶的問題或者解決的不夠徹底,自然不會(huì)被市場(chǎng)所接受!
包括我在內(nèi)的很多程序員,其實(shí)都有一個(gè)通病,那就是很喜歡搞通用的東西,這個(gè)本身沒錯(cuò),通用,意味著低耦合,拿來即用,不用即拋,這在代碼的世界里面其實(shí)是個(gè)好東西,但是,拋開業(yè)務(wù)只看代碼,難怪你做不好!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.