shanghai security defense & alarm association 愛(ài)建網(wǎng)">
如今,“智能”一詞已經(jīng)頻繁地出現(xiàn)在我們的工作、學(xué)習(xí)和生活中。電腦類的產(chǎn)品被冠以“智能”自不用多說(shuō),就連衣食住行也都“智能化”了——虛擬試衣鏡、全時(shí)在線電飯鍋、自動(dòng)吸塵器、導(dǎo)航儀等等,比比皆是“智能”的影子。同樣,攝像機(jī)也經(jīng)歷了模擬、數(shù)字、IP等三個(gè)階段進(jìn)入了智能時(shí)代。本文將就筆者在相關(guān)技術(shù)研究中的一些體會(huì)提出三點(diǎn)思考。
一、攝像機(jī)智能化的目的和內(nèi)涵
“智能”的本意是在現(xiàn)實(shí)世界中賦予人造工具以最大程度的擬人能力,并使人能通過(guò)使用這樣的工具獲得自身相應(yīng)能力的延伸。在技術(shù)實(shí)現(xiàn)上,“智能”一般都依賴于對(duì)應(yīng)的軟硬件計(jì)算能力。攝像機(jī)的擬人功能是視覺(jué),模擬攝像機(jī)實(shí)現(xiàn)了“看得見(jiàn)”,高清攝像機(jī)實(shí)現(xiàn)了“看得清”,那么智能的攝像機(jī)要實(shí)現(xiàn)哪些特質(zhì)呢?
首先,智能的攝像機(jī)要確保“看得清”
在實(shí)際應(yīng)用場(chǎng)景中,這主要與攝像機(jī)的環(huán)境適應(yīng)能力相關(guān)。為適應(yīng)我國(guó)的大氣環(huán)境條件,當(dāng)前,“透霧”已成為攝像機(jī)實(shí)現(xiàn)智能化的迫切需求之一。盡管具備這樣功能的攝像機(jī)早在十年前就已面世,但由于霧、雨、霾、煙等的光學(xué)特性不盡相同,具有普適性的光學(xué)處理與自動(dòng)“霧”判斷算法仍是一個(gè)研究熱點(diǎn)。此外,如何保證在攝像機(jī)應(yīng)用環(huán)境中高速運(yùn)動(dòng)物體的細(xì)節(jié)能被清晰地連續(xù)記錄下來(lái)也成為一種智能化需求。由此,能夠按普通攝像機(jī)的幀率輸出連續(xù)圖像的“快照”算法也成為實(shí)現(xiàn)攝像機(jī)智能化的一個(gè)方面。從“看得清”的立場(chǎng)來(lái)看,(超)低照度和寬動(dòng)態(tài)因?yàn)槎夹枰邢嚓P(guān)的算法支持,也可以被看成是一種“智能化”的功能。從目前的實(shí)踐結(jié)果來(lái)看,實(shí)現(xiàn)了上述功能的攝像機(jī),其視頻效果基本都能超越人眼的觀察能力。
其次,智能的攝像機(jī)要實(shí)現(xiàn)“看得懂”、“看得牢”。
在當(dāng)前大多數(shù)的應(yīng)用場(chǎng)景下,攝像機(jī)主要承擔(dān)了現(xiàn)實(shí)世界捕捉器的角色,它所提供的圖像需要依靠人工來(lái)進(jìn)行判斷和處理。可以這么認(rèn)為,目前大部分的監(jiān)控系統(tǒng)應(yīng)用還處于“半自動(dòng)”狀態(tài),系統(tǒng)的效能沒(méi)有得到充分發(fā)揮。要解決這樣的問(wèn)題,自然就會(huì)想到應(yīng)該設(shè)法讓攝像機(jī)“看懂”圖像,并使監(jiān)控圖像的應(yīng)用從“事后復(fù)現(xiàn)”擴(kuò)展到“事中控制”,進(jìn)而可以溯及“事前發(fā)現(xiàn)”,真正實(shí)現(xiàn)特定的防范功能。要看懂圖像,就需要過(guò)濾掉一些一般的、不重要的信息,而將關(guān)鍵的、重要的信息分離出來(lái),并進(jìn)行應(yīng)用處理。于是,防篡改、車牌識(shí)別、人臉識(shí)別、人群估計(jì)和斗毆行為分析等已成為因?yàn)閿z像機(jī)“看懂”了圖像而提供的、得以廣泛應(yīng)用的能力,其背后則是特定對(duì)象檢測(cè)和識(shí)別算法的支撐。這里值得一提的是,目前已面市的攝像機(jī)“看圖像”的范圍大多為矩形區(qū)域,能處理非矩形(或任意形狀)觀測(cè)區(qū)域的較少見(jiàn)。
在能夠“看懂”圖像后,攝像機(jī)在機(jī)械裝置的承載下就可以緊緊跟隨目標(biāo)對(duì)象的移動(dòng),實(shí)現(xiàn)類似于人頭部轉(zhuǎn)動(dòng)來(lái)盯住目標(biāo)對(duì)象的“看得牢”功能,即所謂的跟蹤取證或跟蹤拍攝。在現(xiàn)實(shí)應(yīng)用中,具有“看得牢”功能的攝像機(jī)可以實(shí)現(xiàn)“撥浪鼓”式的運(yùn)動(dòng),既其跟蹤拍攝的角度可以達(dá)到全周(360度),而且半周(180度)轉(zhuǎn)向和對(duì)焦的速度達(dá)到百毫秒級(jí)。
第三,智能的攝像機(jī)要“善思考”和“易交流”。
越來(lái)越多的攝像頭所產(chǎn)生的視頻數(shù)據(jù)形成了海量的數(shù)據(jù);為節(jié)約和控制建設(shè)及運(yùn)行成本,對(duì)這些數(shù)據(jù)的后續(xù)保存策略目前基本上是依據(jù)“時(shí)間”這樣一個(gè)維度來(lái)進(jìn)行的。如果能增加“內(nèi)容”這樣一個(gè)維度的話,圖像數(shù)據(jù)的保存策略將更顯科學(xué)。為了要讓整個(gè)系統(tǒng)能根據(jù)“內(nèi)容+時(shí)間”來(lái)進(jìn)行所保存數(shù)據(jù)的取舍,就需要讓攝像機(jī)會(huì)“思考”,既將圖像所表達(dá)的意思用“語(yǔ)言”表達(dá)出來(lái)。這里有必要引用兩個(gè)概念:
·視頻內(nèi)容描述數(shù)據(jù):關(guān)于視頻內(nèi)容的數(shù)據(jù)。視頻內(nèi)容的描述分為場(chǎng)景或背景、目標(biāo)或前景以及目標(biāo)的動(dòng)作或變化軌跡等,是對(duì)視頻內(nèi)容的客觀描述。
·視頻語(yǔ)義描述數(shù)據(jù):關(guān)于視頻語(yǔ)義的數(shù)據(jù)。視頻語(yǔ)義具有領(lǐng)域本體屬性,即按照領(lǐng)域本體知識(shí),對(duì)視頻內(nèi)容的理解。視頻語(yǔ)義又可分為三個(gè)層次:底層語(yǔ)義是關(guān)于視頻底層特征的語(yǔ)義,如顏色、場(chǎng)景、前景、目標(biāo)形狀或紋理等的描述;中層語(yǔ)義是關(guān)于視頻目標(biāo)動(dòng)作、行為、密度、流量統(tǒng)計(jì)特性等的描述;高層語(yǔ)義是關(guān)于具有領(lǐng)域本體知識(shí)的視頻事件屬性的描述。
語(yǔ)言是有結(jié)構(gòu)和含義的,所以一旦能用語(yǔ)言數(shù)據(jù)來(lái)描述視頻內(nèi)容及語(yǔ)義,也就實(shí)現(xiàn)了視頻的結(jié)構(gòu)化和語(yǔ)義化。這將從根本上實(shí)現(xiàn)“反應(yīng)快、效率高”的監(jiān)控視頻應(yīng)用以及“成本適中、綠色節(jié)能”的監(jiān)控系統(tǒng)運(yùn)維。
人與人之間的交流需要用語(yǔ)言作為工具,同樣將來(lái)自五湖四海的、具備“思考”能力的攝像機(jī)組合在一起為一個(gè)共同的目標(biāo)而工作時(shí),也需要有一套開放的、分層次定義的語(yǔ)義規(guī)范來(lái)使彼此能夠交流和協(xié)同。作為攝像機(jī)智能化的高級(jí)別任務(wù),視頻語(yǔ)義規(guī)范的研究當(dāng)前正處在起步階段,但其有著較快的發(fā)展速度。業(yè)界應(yīng)該對(duì)此給予足夠的重視,并迅速聯(lián)合起來(lái),一起為國(guó)內(nèi)蓬勃發(fā)展的視頻監(jiān)控行業(yè)未來(lái)的持續(xù)發(fā)展,搶占技術(shù)高地。
綜合以上敘述,從技術(shù)角度來(lái)看,攝像機(jī)的智能化可以理解為:是利用信號(hào)處理技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)和集成電路技術(shù),對(duì)視頻圖像進(jìn)行清晰的復(fù)現(xiàn),并對(duì)其中的感興趣目標(biāo)或異常事件進(jìn)行自動(dòng)的、實(shí)時(shí)的檢測(cè)、跟蹤、識(shí)別、分類、分析和語(yǔ)義提取等。同時(shí),我們也不難得出這樣的結(jié)論,智能化的攝像機(jī)絕不是相關(guān)的技術(shù)和產(chǎn)品供應(yīng)商為純粹的商業(yè)目的而增加的“噱頭”,而是他們?yōu)閿z像機(jī)能夠更好地滿足實(shí)際應(yīng)用需求所進(jìn)行各種技術(shù)創(chuàng)新的成果。
二、攝像機(jī)智能化所面臨的技術(shù)挑戰(zhàn)
攝像機(jī)智能化的實(shí)現(xiàn)依賴于各種圖像處理算法的研究、設(shè)計(jì)和實(shí)現(xiàn)。近些年,國(guó)內(nèi)研究在這方面所取得的成果是十分豐富的,但這些成果所形成的實(shí)際生產(chǎn)力卻仍然有限。究其原因,除了市場(chǎng)需求的發(fā)展需要一個(gè)過(guò)程外,最主要的還是有一些技術(shù)挑戰(zhàn)尚未完全克服。限于篇幅,這里僅摘取其中兩點(diǎn)進(jìn)行分析。
一是“智能”算法的前端化、固態(tài)化。盡管智能化是新一代攝像機(jī)的重要標(biāo)志,但其進(jìn)程卻始于模擬時(shí)代。經(jīng)過(guò)多年的發(fā)展,諸如移動(dòng)偵測(cè)、人臉識(shí)別、自動(dòng)跟蹤等智能視頻算法日趨成熟并在一些特定場(chǎng)合得到了廣泛應(yīng)用。隨著分布式計(jì)算技術(shù)架構(gòu)的發(fā)展,特別是云計(jì)算概念的提出,與攝像機(jī)智能化相關(guān)的算法實(shí)現(xiàn)也呈現(xiàn)出十分明顯的前端化(即內(nèi)置于攝像機(jī))傾向。理論上,將前期大量經(jīng)過(guò)實(shí)踐檢驗(yàn)、比較成熟的算法,從桌面以上的平臺(tái)移植到嵌入式平臺(tái)成為最可行的第一步。但這看似容易的第一步,真的走起來(lái)卻并不輕松。最困難的,也是最能體現(xiàn)技術(shù)水平的就是算法實(shí)現(xiàn)的可移植性。由于不同嵌入式系統(tǒng)在系統(tǒng)結(jié)構(gòu)、指令系統(tǒng)以及處理能力等多方面都存在差異,對(duì)本來(lái)就對(duì)計(jì)算效率極其敏感的圖像處理算法來(lái)說(shuō),要實(shí)現(xiàn)高度的可移植性(無(wú)論是靜態(tài)的還是動(dòng)態(tài)的)是十分困難的。解決之道就是在產(chǎn)品開發(fā)中引入軟件可移植性工程,將自主研制的算法以不同目標(biāo)環(huán)境下的支持庫(kù)形式提供給需求者。
此外,隨著攝像機(jī)所能提供的圖像分辨率的不斷提升,智能視頻算法需要處理的數(shù)據(jù)量也急劇增加。在很多場(chǎng)合下,算法實(shí)現(xiàn)需要固態(tài)化才能滿足實(shí)時(shí)性要求。所謂固態(tài)化就是用專用芯片來(lái)實(shí)現(xiàn)相關(guān)的算法。這就需要有既懂算法軟件、又懂硬件描述語(yǔ)言,具有長(zhǎng)期實(shí)踐經(jīng)驗(yàn)的技術(shù)人員,來(lái)設(shè)計(jì)可靠、高效的算法芯片。
正是因?yàn)樯鲜鰞身?xiàng)工作的技術(shù)門檻高,并要求產(chǎn)品研發(fā)機(jī)構(gòu)保持持續(xù)、穩(wěn)定的資源投入,真正實(shí)現(xiàn)前端智能的攝像機(jī)產(chǎn)品目前尚不豐富。
二是視頻結(jié)構(gòu)化描述技術(shù)。與視頻結(jié)構(gòu)化描述相關(guān)的技術(shù)大致包括機(jī)器視覺(jué)與模式識(shí)別、語(yǔ)義網(wǎng)與知識(shí)庫(kù)、大數(shù)據(jù)或海量信息處理以及系統(tǒng)管理和應(yīng)用技術(shù)等。現(xiàn)階段,上述各項(xiàng)技術(shù)研究,就其本身來(lái)說(shuō),無(wú)論開展的時(shí)間是長(zhǎng)是短,都或多或少取得了一定的成果,有的甚至已經(jīng)得到了大量的應(yīng)用(如車牌識(shí)別)。可是,如果從滿足實(shí)現(xiàn)視頻結(jié)構(gòu)化目標(biāo)所需的角度來(lái)看,“孤島”現(xiàn)象仍十分明顯。我們可以“從視頻圖像中區(qū)分出多個(gè)不同的感興趣目標(biāo)”這一最基礎(chǔ)的工作為例來(lái)理解這方面的情況。作為一項(xiàng)高度擬人化功能,要完成它就需要依據(jù)已有經(jīng)驗(yàn)對(duì)實(shí)時(shí)圖像進(jìn)行時(shí)空分割、特征提取、對(duì)象識(shí)別等處理。這里所說(shuō)的“已有經(jīng)驗(yàn)”在系統(tǒng)中就表現(xiàn)為“樣本庫(kù)”、“特征庫(kù)”或“知識(shí)庫(kù)”。鑒于這些庫(kù)的形成需要經(jīng)歷一定的積累或“學(xué)習(xí)”過(guò)程,在沒(méi)有一個(gè)有效規(guī)則的情況下,這些經(jīng)驗(yàn)的共享和交流是十分困難的,形成“孤島”也就是很自然的了。
三、攝像機(jī)智能化對(duì)產(chǎn)業(yè)發(fā)展的影響
從視頻監(jiān)控產(chǎn)業(yè)的發(fā)展來(lái)看,包括上述技術(shù)挑戰(zhàn)在內(nèi)的各種攝像機(jī)智能化所涉及技術(shù)難題的有效解決,都是行業(yè)本身、業(yè)內(nèi)企業(yè)必須給予足夠重視的。從個(gè)人理解的層面來(lái)看,要能更加有效地推進(jìn)攝像機(jī)智能化,一個(gè)可行的做法就是學(xué)習(xí)國(guó)際上的成功經(jīng)驗(yàn),由對(duì)此感興趣的“產(chǎn)、學(xué)、研、用”機(jī)構(gòu)一起組成一個(gè)合作體,依照“規(guī)范標(biāo)準(zhǔn)統(tǒng)一、知識(shí)合理共享”的原則,以市場(chǎng)需求為導(dǎo)向,形成產(chǎn)業(yè)的、技術(shù)的規(guī)范,以此來(lái)引領(lǐng)整個(gè)行業(yè)朝著“技術(shù)領(lǐng)先、規(guī)模占優(yōu)”的方向發(fā)展。
同時(shí),在當(dāng)前的國(guó)內(nèi)外經(jīng)濟(jì)形勢(shì)下,視頻監(jiān)控行業(yè)無(wú)疑是一個(gè)極其“吸引眼球”的產(chǎn)業(yè),這樣的產(chǎn)業(yè)應(yīng)該具有一定的引領(lǐng)作用。從對(duì)其它產(chǎn)業(yè)的依賴度來(lái)看,攝像機(jī)智能化最合適、最可行的是進(jìn)一步帶動(dòng)半導(dǎo)體行業(yè)的發(fā)展。國(guó)內(nèi)半導(dǎo)體行業(yè)最近一次的興起始于上世紀(jì)九十年代末期,也正是依靠國(guó)內(nèi)有巨大產(chǎn)品需求的多個(gè)帶“金”字工程的推進(jìn),其在十多年間取得了長(zhǎng)足的進(jìn)步。鑒于國(guó)內(nèi)視頻監(jiān)控市場(chǎng)的巨大規(guī)模,特別是在攝像機(jī)智能化達(dá)到了“規(guī)范標(biāo)準(zhǔn)統(tǒng)一”的條件下,或許應(yīng)該為國(guó)內(nèi)的半導(dǎo)體行業(yè)所重視。視頻監(jiān)控行業(yè)憑借其自身的智能化發(fā)展成為推動(dòng)國(guó)內(nèi)半導(dǎo)體行業(yè)再次發(fā)展的源動(dòng)力,這一點(diǎn)確實(shí)值得期待。
滬公網(wǎng)安備 31011202001934號(hào)