圖像識(shí)別技術(shù)在可以被廣泛應(yīng)用之前,一個(gè)重要的挑戰(zhàn)是,怎樣才能知道一個(gè)模型對(duì)未曾出現(xiàn)過(guò)的場(chǎng)景仍然具有很好的泛化能力。在目前的實(shí)踐中,數(shù)據(jù)集被隨機(jī)劃分為訓(xùn)練集和測(cè)試集,模型也相應(yīng)地在這個(gè)數(shù)據(jù)集上被訓(xùn)練和評(píng)估。需要注意的是,在這種做法中,測(cè)試集擁有和訓(xùn)練集一樣的數(shù)據(jù)分布,因?yàn)樗鼈兌际菑木哂邢嗨茍?chǎng)景內(nèi)容和成像條件的數(shù)據(jù)中采樣得到的。然而,在實(shí)際應(yīng)用中,測(cè)試圖像或許會(huì)來(lái)自不同于訓(xùn)練時(shí)的數(shù)據(jù)分布。這些未曾出現(xiàn)過(guò)的數(shù)據(jù)可能會(huì)在視角、大小尺度、場(chǎng)景配置、相機(jī)屬性等方面與訓(xùn)練數(shù)據(jù)不同?;垡暪怆娡瞥龅纳疃葘W(xué)習(xí)算法開(kāi)發(fā)平臺(tái)SpeedDP就能夠通過(guò)不斷的訓(xùn)練,達(dá)到快速圖像標(biāo)注的目的,讓AI能夠更加精確的識(shí)別目標(biāo)。RK3588圖像處理板是工業(yè)級(jí)別的。山西智慧交通圖像識(shí)別模塊研發(fā)
圖像識(shí)別技術(shù)的高價(jià)值應(yīng)用就發(fā)生在你我身邊,例如視頻監(jiān)控、自動(dòng)駕駛和智能醫(yī)療等,而這些圖像識(shí)別進(jìn)展的背后推動(dòng)力是深度學(xué)習(xí)。深度學(xué)習(xí)的成功主要得益于三個(gè)方面:大規(guī)模數(shù)據(jù)集的產(chǎn)生、強(qiáng)有力的模型的發(fā)展以及可用的大量計(jì)算資源。對(duì)于各種各樣的圖像識(shí)別任務(wù),精心設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)已經(jīng)遠(yuǎn)遠(yuǎn)超越了以前那些基于人工設(shè)計(jì)的圖像特征的方法。盡管到目前為止深度學(xué)習(xí)在圖像識(shí)別方面已經(jīng)取得了巨大成功,但在它進(jìn)一步廣泛應(yīng)用之前,仍然有很多挑戰(zhàn)需要我們?nèi)ッ鎸?duì)。山西智慧交通圖像識(shí)別模塊研發(fā)慧視AI算法是無(wú)人設(shè)備的“眼睛”。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,只在近十年內(nèi)才得到廣泛的關(guān)注與發(fā)展。它與機(jī)器學(xué)習(xí)不同的,它模擬我們?nèi)祟愖约喝プR(shí)別人臉的思路。比如,神經(jīng)學(xué)家發(fā)現(xiàn)了我們?nèi)祟愒谡J(rèn)識(shí)一個(gè)東西、觀察一個(gè)東西的時(shí)候,邊緣檢測(cè)類的神經(jīng)元先反應(yīng)比較大,也就是說(shuō)我們看物體的時(shí)候永遠(yuǎn)都是先觀察到邊緣。就這樣,經(jīng)過(guò)科學(xué)家大量的觀察與實(shí)驗(yàn),總結(jié)出人眼識(shí)別的模式是基于特殊層級(jí)的抓取,從一個(gè)簡(jiǎn)單的層級(jí)到一個(gè)復(fù)雜的層級(jí),這個(gè)層級(jí)的轉(zhuǎn)變是有一個(gè)抽象迭代的過(guò)程的。深度學(xué)習(xí)就模擬了我們?nèi)祟惾ビ^測(cè)物體這樣一種方式,首先拿到互聯(lián)網(wǎng)上海量的數(shù)據(jù),拿到以后才有海量樣本,把海量樣本抓取過(guò)來(lái)做訓(xùn)練,抓取到重要特征,建立一個(gè)網(wǎng)絡(luò),因?yàn)樯疃葘W(xué)習(xí)就是建立一個(gè)多層的神經(jīng)網(wǎng)絡(luò),肯定有很多層。有些簡(jiǎn)單的算法可能只有四五層,但是有些復(fù)雜的,像剛才講的谷歌的,里面有一百多層。當(dāng)然這其中有的層會(huì)去做一些數(shù)學(xué)計(jì)算,有的層會(huì)做圖像預(yù)算,一般隨著層級(jí)往下,特征會(huì)越來(lái)越抽象。
隨著相關(guān)技術(shù)的迅猛發(fā)展,城市智慧治安防控模式也在不斷革新,主要以無(wú)人巡邏車、無(wú)人機(jī)為主要載體。無(wú)人巡邏車主要承擔(dān)城區(qū)巡邏防控、遠(yuǎn)程喊話、安防宣傳、視頻巡控等工作任務(wù),這種無(wú)人機(jī)不需要太大的體積通過(guò)搭載AI圖像處理板等傳感器,通過(guò)AI智能算法和圖像處理板的共同作用實(shí)現(xiàn)智能避障,達(dá)到自主巡邏、AI智慧識(shí)別的目的。像成都慧視開(kāi)發(fā)的高性能AI圖像處理板Viztra-HE030,采用先進(jìn)架構(gòu),8核處理器,算力能夠達(dá)到6.0TOPS,能夠?qū)崟r(shí)檢測(cè)無(wú)人巡邏車視野范圍內(nèi)的物體,輔助進(jìn)行信息收集、避障等操作?;垡旳I圖像處理板是高精度識(shí)別的板卡。
YOLO系列算法是目標(biāo)識(shí)別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來(lái)都是實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域的主要范式。該框架被***用于各種實(shí)際應(yīng)用,包括自動(dòng)駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識(shí)別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計(jì)算機(jī)視覺(jué)領(lǐng)域的突破性框架,具備實(shí)時(shí)的端到端目標(biāo)檢測(cè)能力,通過(guò)提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時(shí)參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。慧視RK3399圖像跟蹤板支持圖像識(shí)別模塊識(shí)別目標(biāo)(人、車)。云南國(guó)產(chǎn)化圖像識(shí)別模塊系統(tǒng)
RK3399圖像處理板識(shí)別概率超過(guò)85%。山西智慧交通圖像識(shí)別模塊研發(fā)
試想一下,當(dāng)你走到一家超市,沒(méi)有排隊(duì)稱重,沒(méi)有傳統(tǒng)的掃碼收銀機(jī),也沒(méi)有手機(jī)掃碼支付,只有一臺(tái)擁有5個(gè)攝像頭的收銀機(jī),被AI賦能的智能零售技術(shù)相比于舊的零售業(yè)中所使用的人工結(jié)算方法,條形碼掃碼,以及沒(méi)有被大量使用的RFID技術(shù),智能零售可以讓客戶驗(yàn)到更便捷、更快速的稱重、掃碼、結(jié)賬過(guò)程,用戶好感度由此提升,人臉識(shí)別與顧客會(huì)員體系掛鉤。顧客到店里,超市會(huì)提供更好的服務(wù),結(jié)賬時(shí)的自動(dòng)識(shí)別商品,會(huì)更加節(jié)省人們的時(shí)間,讓購(gòu)物更加便捷。隨著商品識(shí)別發(fā)展,機(jī)器人也可以整理貨架、分揀貨物、移動(dòng)貨位,代替人類做一些簡(jiǎn)易的、重復(fù)性的工作,生產(chǎn)效率會(huì)提升很多。山西智慧交通圖像識(shí)別模塊研發(fā)