圖像分類是機器學(xué)習(xí)和模式識別領(lǐng)域中一個十分重要的研究熱點,其目的是基于標(biāo)簽已知且完整的圖像數(shù)據(jù)集訓(xùn)練一個分類器,并對新樣本的標(biāo)簽進(jìn)行預(yù)測和分類。傳統(tǒng)的圖像分類問題通常是單標(biāo)簽分類問題,即一張圖片僅對應(yīng)一個類別標(biāo)簽。然而,現(xiàn)實世界的圖像往往具有多義性,即一張圖片通常和多個類別標(biāo)簽相關(guān)聯(lián)。針對傳統(tǒng)的單標(biāo)簽學(xué)習(xí)框架難以解決的多義性問題,通過給樣本對象明確地指定一組相關(guān)類別標(biāo)簽的標(biāo)簽子集,多標(biāo)簽學(xué)習(xí)框架應(yīng)運而生。現(xiàn)有的大多數(shù)多標(biāo)簽學(xué)習(xí)算法都是假設(shè)訓(xùn)練樣本的標(biāo)簽集是完整的,然而,在實際應(yīng)用中,訓(xùn)練樣本的標(biāo)簽往往是不完整的。并且,訓(xùn)練樣本的標(biāo)簽通常采用人工標(biāo)注,耗時又耗力,而且由于人工標(biāo)注存在主觀性,標(biāo)簽語義存在歧義,致使訓(xùn)練樣本的部分標(biāo)簽漏標(biāo)、缺失。隨著互聯(lián)網(wǎng)和社交媒體的發(fā)展,大量由用戶標(biāo)注并上傳的圖像數(shù)據(jù)唾手可得,但是這些圖像數(shù)據(jù)往往存在標(biāo)簽缺失問題。如何利用這些容易獲取卻具有標(biāo)簽缺失問題的數(shù)據(jù)來訓(xùn)練一個健壯、有效的多標(biāo)簽分類算法,仍然是一個亟待解決的問題。本文主要研究針對存在標(biāo)簽缺失問題的多標(biāo)簽圖像分類問題,主要研究內(nèi)容如下:1.利用標(biāo)簽間固有的關(guān)聯(lián)性以及示例間的相似性,提出了一種基于示例級和標(biāo)簽級關(guān)聯(lián)的多標(biāo)簽圖像分類算法。該算法首先采用線性重組策略計算每個示例與其近鄰示例間的相似性,其次采用標(biāo)簽矩陣的低秩表示挖掘標(biāo)簽間的高階關(guān)聯(lián)性,然后采用一種加權(quán)最小二乘損失函數(shù)保證給定標(biāo)簽與預(yù)測標(biāo)簽的一致性,最后,通過拉普拉斯流形正則化聯(lián)合兩種關(guān)聯(lián)以及損失函數(shù)構(gòu)建最終的目標(biāo)函數(shù)。在多個圖像數(shù)據(jù)集上的實驗證明,該算法能夠有效處理標(biāo)簽缺失問題。2.基于低秩特征映射與低秩標(biāo)簽恢復(fù),提出了一種針對標(biāo)簽缺失問題的雙重低秩的多標(biāo)簽圖像分類算法。該算法首先假設(shè)算法的特征映射系數(shù)矩陣具有低秩性,來挖掘特征空間中的標(biāo)簽關(guān)聯(lián)。然后假設(shè)標(biāo)簽關(guān)聯(lián)矩陣是一個低秩矩陣,來挖掘標(biāo)簽間的高階關(guān)聯(lián)性,并同時利用低秩的標(biāo)簽關(guān)聯(lián)恢復(fù)原標(biāo)簽矩陣的缺失標(biāo)簽。然后通過保證預(yù)測標(biāo)簽與恢復(fù)后的標(biāo)簽之間的一致性,將標(biāo)簽關(guān)聯(lián)的提取、標(biāo)簽恢復(fù)與模型的訓(xùn)練結(jié)合到一起。最后通過正則化引入示例級的關(guān)聯(lián)性。