中國(guó)知網(wǎng)論文查重入口,CNKI知網(wǎng)論文檢測(cè)系統(tǒng)-CNKI知網(wǎng)查重檢測(cè)系統(tǒng)入口
發(fā)布時(shí)間:2023-08-20 01:03:52 作者:知網(wǎng)小編 來源:www.derer.cn
作者分別來自天津大學(xué)、武漢大學(xué)、騰訊AI實(shí)驗(yàn)室、美國(guó)天普大學(xué)。 感謝各位大牛! 作者首先從算法實(shí)用性角度討論了人臉特征點(diǎn)檢測(cè)問題的面臨的挑戰(zhàn)。 人臉表情變化很大,真實(shí)環(huán)境光照復(fù)雜,而且現(xiàn)實(shí)中大量存在人臉局部被遮擋的情況等。
如果采取更大的網(wǎng)絡(luò),特征點(diǎn)的預(yù)測(cè)會(huì)更加準(zhǔn)確魯棒,但耗時(shí)多,為了在速度和性能上做找到平衡點(diǎn),使用較小的網(wǎng)絡(luò),并采用級(jí)聯(lián)的思想,先進(jìn)行粗檢測(cè),然后微調(diào)特征點(diǎn)位置。 下面是最終預(yù)測(cè)人臉特征點(diǎn)的landmarks_detection.py,其中人臉檢測(cè)采用的是級(jí)聯(lián)CNN或者opencv人臉檢測(cè),在人臉檢測(cè)的基礎(chǔ)上預(yù)測(cè)人臉特征點(diǎn)位置,并將預(yù)測(cè)的相對(duì)位置轉(zhuǎn)換成圖像上的絕對(duì)坐標(biāo)。
作者認(rèn)為人臉檢測(cè)和人臉關(guān)鍵點(diǎn)檢測(cè)兩個(gè)任務(wù)之間往往存在著潛在的聯(lián)系,然而大多數(shù)方法都未將兩個(gè)任務(wù)有效的結(jié)合起來,本文為了充分利用兩任務(wù)之間潛在的聯(lián)系,提出一種多任務(wù)級(jí)聯(lián)的人臉檢測(cè)框架,將 人臉檢測(cè)和人臉關(guān)鍵點(diǎn)檢測(cè) 同時(shí)進(jìn)行。 MTCNN 包含三個(gè)級(jí)聯(lián)的多任務(wù)卷積神經(jīng)網(wǎng)絡(luò),分別是 Proposal Network (P-Net)、Refine Network (R-Net)、Output Network (O-Net) ,每個(gè)多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)均有三個(gè)學(xué)習(xí)任務(wù),分別是 人臉分類、邊框回歸和關(guān)鍵點(diǎn)定位 。
該論文由港中文的孫祎、王曉剛、湯曉鷗提出,應(yīng)該是最早使用 CNN 進(jìn)行人臉關(guān)鍵點(diǎn)檢測(cè)的論文之一了。 在論文中,作者設(shè)計(jì)了 Three-level cascaded CNNs 用于人臉關(guān)鍵點(diǎn)檢測(cè)(5 Points):Left Eye Center (LE),Right Eye Center (RE),Nose Tip (N),Left Mouth Corner (LM),Right Mouth Corner (RM)。 在模型的各個(gè) level 中,模型會(huì)對(duì)各個(gè)人臉關(guān)鍵點(diǎn)做多次預(yù)測(cè),取其平均值。