午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

屬性判定方法

文檔序號:6409093閱讀:476來源:國知局
專利名稱:屬性判定方法
技術(shù)領(lǐng)域
本發(fā)明涉及屬性判定方法,該方法用電視攝像機(jī)等信號輸入裝置和具有計算機(jī)的信號處理裝置,判定輸入圖象中含有圖形屬于什么樣的種類。
近年來,在工業(yè)產(chǎn)品等的檢查工序中,產(chǎn)品的正確種類分類與不良種類分類等,成為重要課題之一。這些都期望自動化高且廣泛使用電視攝像機(jī)等的圖像輸入裝置和具有計算機(jī)的圖像處理裝置。例如,使用自動識別寫在產(chǎn)品上的制造號碼等的電視攝像機(jī)的文字識別裝置,就是其中一例。
下面,對用以往電視攝像機(jī)的文字識別裝置的技術(shù)例進(jìn)行說明。

圖15表示裝置的大概結(jié)構(gòu)。通過半透鏡14,在將光源15來的照明光照射于對象11的表面的同時,通過半透鏡14,采用電視攝像機(jī)12,對對象11的表面進(jìn)行攝像。該電視攝像機(jī)12具有電荷耦合器件傳感器,對獲得的每個像素的濃淡信號,用數(shù)字化形式在識別處理部13中處理。又,識別處理部13當(dāng)然設(shè)有記憶圖像數(shù)據(jù)的記憶部和存儲實(shí)行文字識別處理程序的存儲部。
圖16表示識別處理部的結(jié)構(gòu)。從電視攝像機(jī)12輸出的圖像信號a,被輸入到模/數(shù)(A/D)轉(zhuǎn)換電路21中,在A/D轉(zhuǎn)換電路21中數(shù)字化后輸出的信號b,被存儲在圖像存儲器22中。從圖像存儲器22輸出的圖像數(shù)據(jù)c,在二進(jìn)制化電路23中轉(zhuǎn)換成二進(jìn)制圖像d。如圖17所示,在二進(jìn)制化電路23中,按照圖像數(shù)據(jù)27的“黑”是文字部分、“白”是背景部分,進(jìn)行二進(jìn)制化。二進(jìn)制圖像d輸入到文字截出電路24,輸出截出圖像e。如圖18所示,在文字截出電路24中,檢出外接每個字的外接矩形28,將文字列分離成字。文字的截出大多以被投影于水平軸和垂直軸的投影數(shù)據(jù)為依據(jù)進(jìn)行文字的分離。被分離后的每個文字的截出圖像,被輸入到標(biāo)準(zhǔn)化電路25,輸出網(wǎng)格圖形數(shù)據(jù)f。在標(biāo)準(zhǔn)化電路25中,各文字外接矩形內(nèi)存在的像素被標(biāo)準(zhǔn)化變換成適當(dāng)?shù)木W(wǎng)格大小的圖形。對應(yīng)于各網(wǎng)格的復(fù)數(shù)像素的變換,按它們的平均值、最大值、最小值、中心值、最多頻率值等進(jìn)行。圖19中,被分離后的每個文字的圖像29表示成變換為橫5×縱9的網(wǎng)格大小的網(wǎng)格圖形30的樣子。網(wǎng)格圖形數(shù)據(jù)f輸入到文字判定電路26,輸出文字判定結(jié)果g。作為文字,在工業(yè)應(yīng)用場合,常用的是英文數(shù)字“0”~“9”和字母“A”~“Z”以及特殊字符“-”共37個文字。文字判定電路26,是將網(wǎng)格圖形數(shù)據(jù)與哪一個文字相近,作為結(jié)果進(jìn)行輸出。圖20表示前述37個文字的標(biāo)準(zhǔn)圖形數(shù)據(jù)。
文字判定電路26中,常用的有神經(jīng)網(wǎng)絡(luò)(下面記為NN)。關(guān)于NN,有各種結(jié)構(gòu)(參考文獻(xiàn)飯沼編、“神經(jīng)元計算機(jī)”、技術(shù)評論社、平成元年9月刊),圖21所示的是實(shí)際中常被應(yīng)用的視感控器型NN的結(jié)構(gòu)。這種NN由輸入層、中間層和輸出層的三層組成,采用稱為各自多數(shù)的神經(jīng)元的非線性元件構(gòu)成。在輸入層中有用“0”表示背景部分和用“1”表示文字部分的值的45個(橫5×縱9)神經(jīng)元。在輸出層中有對應(yīng)于被判定的文字的英文數(shù)字“0”~“9”和字母“A”~“Z”以及特殊字符“-”的37個神經(jīng)元。在這里,輸入層與中間層、中間層與輸出層,在各自神經(jīng)元間連線,連線上定義權(quán)重ω。各神經(jīng)元對所有的連線,總和被連接的神經(jīng)元的輸出y與其連線上定義的權(quán)重ω的積,然后用非線性函數(shù)處理后,輸出0.0到1.0的值。這里,根據(jù)權(quán)重ω的值,該NN持有各自的特性。該權(quán)重的決定中,給予實(shí)際的數(shù)據(jù),輸出層的神經(jīng)元,視輸出是否為期待的輸出,多次反復(fù)進(jìn)行對該誤差部分權(quán)重的修正。作為這種修正方法,反向傳播常被使用。(D.E.Rumelhart等通過反向傳播錯誤的學(xué)習(xí)表示,自然雜志323號,533~536頁,(1986))。給予輸入層標(biāo)準(zhǔn)圖形數(shù)據(jù),假設(shè)輸出層的期待輸出為對應(yīng)于該文字的神經(jīng)元是1.0,其余的神經(jīng)元是0.0,多次反復(fù)進(jìn)行對該誤差部分權(quán)重的修正。在實(shí)施例中,反復(fù)修正作業(yè)直至所有輸出層神經(jīng)元的值與期待的輸出值的誤差小于0.1。對于修正作業(yè)完成后的NN,進(jìn)行判定作業(yè)的情況,如圖22所示,當(dāng)輸入層中輸入“A”,對應(yīng)于輸出層的“A”的神經(jīng)元的輸出比其它神經(jīng)元要大,理想情況下,對應(yīng)于“A”的神經(jīng)元是接近1.0的值,其余神經(jīng)元是接近0.0的值。在實(shí)施例中,文字的判定條件如下。
1)當(dāng)輸出層的神經(jīng)元的值大于0.7時,以該對應(yīng)文字為判定文字(判定條件1)。
2)當(dāng)輸出層的神經(jīng)元中第一號中的最大值與第二號中的最大值的差大于0.3時,以與第一號對應(yīng)的文字為判定文字(判定條件2)。
3)輸出層的任一神經(jīng)元均不能輸出前述那樣的值時,作為“?”為不能判定。
用前述以往NN的判定方法,存在不能用被要求的可靠性進(jìn)行屬性判定(文字判定)的問題。下面根據(jù)實(shí)際的技術(shù)例進(jìn)行說明。
在圖20所示的標(biāo)準(zhǔn)圖形數(shù)據(jù)中,對于由輸入層45(橫5×縱9的二進(jìn)制(0,1)圖形)、中間層45、輸出層37(英文數(shù)字“0”~“9”、字母“A”~“Z”、特殊字符“-”)三層所成的網(wǎng)絡(luò),進(jìn)行學(xué)習(xí)后的結(jié)果實(shí)施所成。
圖23~圖26是用于文字判定的檢定的文字圖形,“2”、“9”、“A”、“F”四種文字每種各有30個。圖中用“*”表示黑的“1”,用“_”表示白的“0”。
關(guān)于文字“2”代表的結(jié)果所示,在圖23中,對于(1),最大輸出的神經(jīng)元是“2”,其值是0.86,滿足判定條件1。對于(2),最大輸出的神經(jīng)元是“2”,其值是0.63,第二號中的最大輸出的神經(jīng)元是“Z”,其值是0.12,因它們的差是0.51,滿足判定條件2。但對于(4),最大輸出的神經(jīng)元是“2”,其值是0.34,第二號中的最大輸出的神經(jīng)元是“S”,其值是0.15,因它們的差是0.19,故不能判定。同樣對于(9),最大輸出的神經(jīng)元是“2”,其值是0.58,第二號中的最大輸出的神經(jīng)元是“C”,其值是0.48,因它們的差是0.10,故不能判定。
關(guān)于文字“9”代表的結(jié)果所示,在圖24中,對于(1),最大輸出的神經(jīng)元是“9”,其值是0.90,滿足判定條件1。對于(3),最大輸出的神經(jīng)元是“9”,其值是0.37,第二號中的最大輸出的神經(jīng)元是“5”,其值是0.07,因它們的差是0.30,滿足判定條件2。但對于(2),最大輸出的神經(jīng)元是“9”,其值是0.27,第二號中的最大輸出的神經(jīng)元是“3”,其值是0.07,因它們的差是0.20,故不能判定。同樣對于(8),最大輸出的神經(jīng)元是“9”,其值是0.38,第二號中的最大輸出的神經(jīng)元是“S”,其值是0.18,因它們的差是0.20,故不能判定。
關(guān)于文字“A”代表的結(jié)果所示,在圖25中,對于(1),最大輸出的神經(jīng)元是“A”,其值是0.91,滿足判定條件1。對于(3),最大輸出的神經(jīng)元是“A”,其值是0.66,第二號中的最大輸出的神經(jīng)元是“4”,其值是0.11,因它們的差是0.55,滿足判定條件2。但對于(22),最大輸出的神經(jīng)元是“A”,其值是0.22,第二號中的最大輸出的神經(jīng)元是“M”,其值是0.08,因它們的差是0.14,故不能判定。同樣對于(26),最大輸出的神經(jīng)元是“Q”,其值是0.52,第二號中的最大輸出的神經(jīng)元是“A”,其值是0.38,因它們的差是0.14,故不能判定。
關(guān)于文字“F”代表的結(jié)果所示,在圖26中,對于(1),最大輸出的神經(jīng)元是“F”,其值是0.91,滿足判定條件1。對于(3),最大輸出的神經(jīng)元是“F”,其值是0.65,第二號中的最大輸出的神經(jīng)元是“P”,其值是0.27,因它們的差是0.39,滿足判定條件2。但對于(5),最大輸出的神經(jīng)元是“K”,其值是0.12,第二號中的最大輸出的神經(jīng)元是“F”,其值是0.09,因它們的差是0.03,故不能判定。同樣對于(6),最大輸出的神經(jīng)元是“K”,其值是0.11,第二號中的最大輸出的神經(jīng)元是“F”,其值是0.09,因它們的差是0.02,故不能判定。
在前述的實(shí)驗(yàn)中,實(shí)驗(yàn)文字也會包含與相當(dāng)標(biāo)準(zhǔn)的圖形數(shù)據(jù)相差懸殊的東西,人們?nèi)绾尾拍茏R別可能的文字呢?在120全部的結(jié)果中,正確的解答是82/120(68%),錯誤的解答是5/120(4%),不能判定是33/120(28%)。從前述結(jié)果可知,存在錯誤的解答和不能判定的許多問題。
又,以NN能力的改善為目標(biāo),即使致力于改變結(jié)構(gòu),也因權(quán)重ω的決定方法提供對于實(shí)際數(shù)據(jù)的期待輸出進(jìn)行自己組織化,有存在內(nèi)部構(gòu)造成為黑盒子,難以找到最適當(dāng)方法的問題。
鑒于前述以往的問題,本發(fā)明的目的是在提供屬性判定正答率高且可靠性高的屬性判定的同時,進(jìn)一步提供能力改善且比較容易地進(jìn)行的屬性判定方法。
本發(fā)明的屬性判定方法是比較輸入圖像中包含的輸入圖形的復(fù)數(shù)特征數(shù)據(jù)與從多數(shù)標(biāo)準(zhǔn)圖形中求得的特征數(shù)據(jù)的成員函數(shù),判定與輸入圖形類似度最高的標(biāo)準(zhǔn)圖形的屬性判定方法。對于全部特征數(shù)據(jù),求得對應(yīng)輸入圖形各特征數(shù)據(jù)的各成員函數(shù)的輸出值,求出對于全部特征數(shù)據(jù)輸出值的綜合值,以對應(yīng)該判定的各標(biāo)準(zhǔn)圖形求值,判別綜合值最高的標(biāo)準(zhǔn)圖形作為特征。
在適用中,對于輸入圖像中包含的輸入圖形,用預(yù)定的神經(jīng)網(wǎng)絡(luò),進(jìn)行類似度高的標(biāo)準(zhǔn)圖形的判定,選擇其結(jié)果中上位的復(fù)數(shù)個標(biāo)準(zhǔn)圖形,用選擇的標(biāo)準(zhǔn)圖形,以前述方法進(jìn)行判別。又,在該情況綜合值中,最好同時考慮神經(jīng)網(wǎng)絡(luò)的判定結(jié)果。
又,對由標(biāo)準(zhǔn)圖形的特征數(shù)據(jù)作成的成員函數(shù),在被輸入的特征數(shù)據(jù)中,理想的是輸出其最大的值,而對其前后的特征數(shù)據(jù),設(shè)定小的值被輸出。
再者,用網(wǎng)格圖形表示輸入圖形,根據(jù)所用的在用作特征數(shù)據(jù)的每列網(wǎng)格圖形數(shù)據(jù)中由上往下及由下往上推進(jìn)時遇到黑的網(wǎng)格時合計白的網(wǎng)格的上下縱結(jié)構(gòu)向量和、每行網(wǎng)格圖形數(shù)據(jù)中由左到右及由右到左推進(jìn)時遇到黑的網(wǎng)格時合計白的網(wǎng)格的左右橫結(jié)構(gòu)向量和、求出網(wǎng)格圖形數(shù)據(jù)的上半部分和下半部分及左半部分和右半部分的黑的面積差后的上下與左右的面積差、在中心列求出上下方向與黑交叉的次數(shù)的上下交叉次數(shù),進(jìn)行文字識別。
根據(jù)本發(fā)明的屬性判定方法,比較從多數(shù)標(biāo)準(zhǔn)圖形求得的特征數(shù)據(jù)的成員函數(shù)和輸入圖形的復(fù)數(shù)的特征數(shù)據(jù),對于全部標(biāo)準(zhǔn)圖形求出關(guān)于全部特征量的成員函數(shù)輸出值的綜合值,用判別綜合值最大的標(biāo)準(zhǔn)圖形的模糊推理,進(jìn)行屬性判別,因此根據(jù)適當(dāng)設(shè)定其特征數(shù)據(jù),能進(jìn)行屬性判定的正答率高且可靠性高的屬性判定。又,比較以往的神經(jīng)網(wǎng)絡(luò),判定方法的結(jié)構(gòu)是明確的,因能使必要的特征數(shù)據(jù)組合,故能按特征數(shù)據(jù)的補(bǔ)充和變更進(jìn)行進(jìn)一步的確當(dāng)?shù)膶傩耘卸?,能力改善也比較容易地進(jìn)行。
又,神經(jīng)網(wǎng)絡(luò)對應(yīng)其內(nèi)部構(gòu)造是黑盒子,不需要特征數(shù)據(jù)選定等費(fèi)時的工作,不受其合適與否的影響,而且因精細(xì)判別中遇到的問題,用粗糙的判別也是有效的,用預(yù)定的神經(jīng)網(wǎng)絡(luò),進(jìn)行類似度高的標(biāo)準(zhǔn)圖形的判定,選擇上位的復(fù)數(shù)個的標(biāo)準(zhǔn)圖形,用選擇的標(biāo)準(zhǔn)圖形在前述方法中進(jìn)行判別時,能在較少的數(shù)據(jù)處理中進(jìn)行可靠性高的判別的同時,特征數(shù)據(jù)的選定也變得簡單。
圖1是本發(fā)明屬性判定方法一實(shí)施例的學(xué)習(xí)方法的處理流圖。
圖2是同一實(shí)施例的判定方法的處理流圖。
圖3是同一實(shí)施例的特征量的縱構(gòu)造向量和的說明圖。
圖4是同一實(shí)施例的特征量的橫構(gòu)造向量和的說明圖。
圖5是同一實(shí)施例的特征量的面積差的說明圖。
圖6是同一實(shí)施例的特征量的上下交差次數(shù)的說明圖。
圖7是成員函數(shù)的說明圖。
圖8是同一實(shí)施例的成員函數(shù)一例的說明圖。
圖9是同一實(shí)施例的推定值求法的說明圖。
圖10是同一實(shí)施例的模糊推理方法的說明圖。
圖11是表示對應(yīng)于同一實(shí)施例的標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù)的各基準(zhǔn)特征量的圖。
圖12是表示對應(yīng)于同一實(shí)施例的對像圖形“2”的判定結(jié)果的圖。
圖13是本發(fā)明屬性判定方法其它實(shí)施例的處理流圖。
圖14是表示對應(yīng)于同一實(shí)施例的對象圖形“2”的判定結(jié)果的圖。
圖15是文字識別裝置的大概結(jié)構(gòu)。
圖16是以往技術(shù)例文字識別裝置的圖像處理部的結(jié)構(gòu)圖。
圖17是被二進(jìn)制化的圖像的說明圖。
圖18是截出文字的圖像的說明圖。
圖19是變換成網(wǎng)格圖形數(shù)據(jù)的說明圖。
圖20是標(biāo)準(zhǔn)圖形數(shù)據(jù)的說明圖。
圖21是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的說明圖。
圖22是神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)輸入時的反應(yīng)的說明圖。
圖23是判定對象是“2”的情況的判定檢定用文字?jǐn)?shù)據(jù)的說明圖。
圖24是判定對象是“9”的情況的判定檢定用文字?jǐn)?shù)據(jù)的說明圖。
圖25是判定對象是“A”的情況的判定檢定用文字?jǐn)?shù)據(jù)的說明圖。
圖26是判定對象是“F”的情況的判定檢定用文字?jǐn)?shù)據(jù)的說明圖。
符號的說明1是特征量提取電路,2是成員函數(shù)提取電路,3是特征量提取電路,4是成員函數(shù)比較電路,5是推定值合計電路,f是網(wǎng)格圖形數(shù)據(jù),i是標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù),j是特征量,K是成員函數(shù),l是推定值,m是綜合推定值。
實(shí)施例1以下,對本發(fā)明的第一實(shí)施例,參照圖1~圖12進(jìn)行說明。
圖1表示屬性判定方法的學(xué)習(xí)方法的處理流圖,圖2表示屬性判定方法的處理流圖。到求得輸入圖形為止與以往的技術(shù)相同,對二進(jìn)制化網(wǎng)格化了的網(wǎng)格圖形進(jìn)行下面的處理。這里,用橫5×縱9的網(wǎng)格圖形進(jìn)行說明。
首先,對學(xué)習(xí)方法進(jìn)行說明。這是為了在文字判定中從必要的特征量中求出成員函數(shù)。
在特征量提取電路1中,輸入標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù)i,輸出必要的特征量j。在這里,作為特征量用的是縱結(jié)構(gòu)向量和l,縱結(jié)構(gòu)向量和2,橫結(jié)構(gòu)向量和1,橫結(jié)構(gòu)向量和2,上下面積和,左右面積和,上下交叉次數(shù)的特征量1~特征量7。
縱結(jié)構(gòu)向量和1(特征量1UDVEC),如圖3所示,是合計求得每列從上向下推進(jìn)遇到第一個黑的網(wǎng)格時求得白的網(wǎng)格個數(shù)的特征量。在圖3“U”的例中,縱結(jié)構(gòu)向量和1是0+8+8+8+0=24。
縱結(jié)構(gòu)向量和2(特征量2DUVEC),是合計求得每列從下向上推進(jìn)遇到第一個黑的網(wǎng)格時求得白的網(wǎng)格個數(shù)的特征量。在圖3“U”的例中,縱結(jié)構(gòu)向量和2是0+0+0+0+0=0。
橫結(jié)構(gòu)向量和1(特征量3LRVEC),如圖4所示,是合計求得每行從左向右推進(jìn)遇到第一個黑的網(wǎng)格時求得白的網(wǎng)格個數(shù)的特征量。在圖4“3”的例中,橫結(jié)構(gòu)向量和1是0+4+4+4+0+4+4+4+0=24。
橫結(jié)構(gòu)向量和2(特征量4RLVEC),是合計求得每行從右向左推進(jìn)遇到第一個黑的網(wǎng)格時求得白的網(wǎng)格個數(shù)的特征量。在圖4“3”的例中,橫結(jié)構(gòu)向量和2是0+0+0+0+0+0+0+0+0=0。
上下面積差(特征量5UDDIFF),如圖5所示,是求得上半部分橫4×縱4的黑的面積與下半部分橫4×縱4的黑的面積的差的特征量。在圖5“U”的例中,上下面積差是8-11=-3。
左右面積差(特征量6LRDIFF),如圖5所示,是求得左半部分橫2×縱9的黑的面積與右半部分橫2×縱9的黑的面積的差的特征量。在圖5“U”的例中,左右面積差是10-10=0。
上下交差次數(shù)(特征量7VCN),如圖6所示,是求得中心列中從上向下推進(jìn)與黑相交次數(shù)的特征量。在圖6“3”的例中,上下交差次數(shù)是3。
在特征量提取電路1中求得的特征量j,輸入到成員函數(shù)提取電路2,輸出成員函數(shù)k。所謂成員函數(shù),就是以標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù)的特征量(下面稱作基準(zhǔn)特征量)為中心,持有一定擴(kuò)展的輸入輸出函數(shù)。以應(yīng)該判定的網(wǎng)格圖形數(shù)據(jù)的特征量為輸入,輸出估計與基準(zhǔn)特征量多少間隔的推定值。這里,基準(zhǔn)特征量輸入時為輸出最大值1.0,作成以它為中心形成的擴(kuò)展的函數(shù)。圖7表示成員函數(shù),橫軸上為特征量,縱軸上取為推定值。在圖7的例中,對于基準(zhǔn)特征量S,用寬度A形成繼續(xù)輸出推定值1.0的區(qū)間,用寬度B形成繼續(xù)輸出推定值0.0~1.0的區(qū)間,用寬度C形成繼續(xù)輸出推定值-1.0~0.0的區(qū)間。又,各寬度A、B、C考慮到與其它標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù)的特征量的重疊,按經(jīng)驗(yàn)進(jìn)行設(shè)定。例如,各文字的相同基準(zhǔn)特征量為0~30的情況,設(shè)定寬度A=1,寬度B=2,寬度C=5的限度是適當(dāng)?shù)?。圖8表示基準(zhǔn)特征量S是10,寬度A=1,寬度B=2,寬度C=5情況的成員函數(shù)。
接著,關(guān)于判定方法,參照圖2進(jìn)行說明。這是根據(jù)求得文字判定中必要的特征量、與成員函數(shù)比較求得推定值、最后求得綜合推定值,進(jìn)行判定。
在特征量提取電路3中,輸入應(yīng)該判定的網(wǎng)格圖形數(shù)據(jù)f,提取出必要的特征量j。在這里,用對應(yīng)于預(yù)先要求的基準(zhǔn)特征量的縱結(jié)構(gòu)向量和1、縱結(jié)構(gòu)向量和2、橫結(jié)構(gòu)向量和1、橫結(jié)構(gòu)向量和2、上下面積差、左右面積差和上下交叉次數(shù)。在成員函數(shù)比較電路4中,輸入該特征量j,輸出推定值l。在這里對采用的7個特征量,同樣地進(jìn)行。圖9表示推定值的求法,對于被輸入的特征量(23),求得作為輸出的推定值(0.5)。
在推定值合計電路5中,輸入各推定值l,輸出綜合推定值m。圖10表示的是模糊推理方法,求出關(guān)于7個特征量對應(yīng)的各文字的成員函數(shù)的推定值,沿水平軸求得各個文字的綜合推定值,最終以持有最大綜合推定值的文字作為判定結(jié)果。
接著,對實(shí)際的網(wǎng)格圖形數(shù)據(jù),以適用前述判定處理的例子進(jìn)行說明。
對于圖20所示的標(biāo)準(zhǔn)網(wǎng)格圖形數(shù)據(jù),計算如圖11所示的基準(zhǔn)特征量。于是,對于特征量1~6,用寬度A=1、寬度B=2、寬度C=5,對于特征量7,寬度A=0、寬度B=1、寬度C=1,作成成員函數(shù)。至此學(xué)習(xí)結(jié)束。
接著,參照圖12對判定處理進(jìn)行說明。對于圖12(a)所示的判定對象的網(wǎng)格圖形10,圖12(b)表示關(guān)于各文字對于各自特征量的成員函數(shù)的推定值和對于各文字的綜合推定值。對于圖12(a),“1”是黑、“0”是白,求出該對象圖形10的各個特征量,特征量1(UD-VEC)是1+0+0+0+0=1,特征量2(DUVEC)是0+0+0+0+0=0,特征量3(LRVEC)是1+0+4+3+2+1+0+0+0=11,特征量4(RLVEC)是0+0+0+1+2+3+4+4+0=14,特征量5(UD-DIFF)是8-8=0,特征量6(LRDIFF)是7-7=0,特征量7(VCN)是3。對各文字求得各特征量的推定值,對求得的其綜合推定值進(jìn)行處理,這里為簡單起見,僅例示“2”、“3”、“C”、“E”、“I”、“S”、“Z”,對其它文字省略其圖示。對于各文字的綜合推定值,“2”是7.00、“3”是1.30、“C”是0.10、“E”是1.20、“I”是4.00、“S”是6.00、“Z”是6.50,對象圖形10持有最大推定值的“2”被判定。
這些處理,根據(jù)適當(dāng)?shù)匮a(bǔ)充和變更適于判定文字的特征量,能使判定能力得到相當(dāng)?shù)靥岣?。又,因處理非常簡單,即使特征量的?shù)目相當(dāng)多,也不成問題。
實(shí)施例2接著,對本發(fā)明的第二實(shí)施例進(jìn)行說明。該實(shí)施例是預(yù)先進(jìn)行使用NN的處理后,根據(jù)前述的模糊推理進(jìn)行判定處理。也就是說,在基于NN的判別方法中,即使前述那樣精度高的判別中遇到問題,對于大體上的文字判定,對應(yīng)正確解答的文字的輸出層神經(jīng)元的值,只送入上面3位以內(nèi),作為粗糙的判別方法是簡單且好的方法。本實(shí)施例在預(yù)先NN處理中選擇文字后,根據(jù)模糊推理進(jìn)行判定。
圖13表示文字判定的流圖。到作成網(wǎng)格圖形數(shù)據(jù)為止,與前述實(shí)施例相同。步驟#1中,進(jìn)行與以往技術(shù)例相同地NN判定處理。接著在步驟#2中,若NN判定結(jié)果在判定閥值以上,步驟3中對應(yīng)的文字作為結(jié)果。若在判定閥值以下,在用模糊推理推進(jìn)的同時,僅對持有其間有NN判定結(jié)果的程度大的值,進(jìn)行模糊推理。這樣,在步驟4中,只從神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù)中挑選的數(shù)據(jù),做NN輸出數(shù)據(jù)的點(diǎn)集。在步驟5中,僅對挑選的數(shù)據(jù)(文字)的特征量進(jìn)行提取。在步驟6中,從各成員函數(shù)根據(jù)模糊推理做點(diǎn)集。在步驟7中,若模糊推理判定結(jié)果在判定閥值以上,步驟8中對應(yīng)的文字作為結(jié)果。若在判定閥值以下,在步驟9中是作為判定不可能。
作為說明對于實(shí)際的圖形數(shù)據(jù)適用的技術(shù)例,對于圖20中表示的標(biāo)準(zhǔn)網(wǎng)格圖形,用圖14(a)表示判定對象的網(wǎng)格圖形10,圖14(b)表示關(guān)于被選擇的各文字,對于NN的輸出數(shù)據(jù)和各自特征量的成員函數(shù)的推定值和對各文字的綜合推定值。NN輸出數(shù)據(jù)選擇并保留0.01以上,將該輸出數(shù)據(jù)乘以10倍,加以模糊推理。最終持有最大綜合推定值的“2”被判定。
除上述7個特征量外,增加適當(dāng)?shù)奶卣髁?,選用全部26個特征量,對圖23~圖26所示的120個文字圖表的判別中適用的具體適用技術(shù)例,正確的解答是108/120(90%),錯誤的解答是1/120(1%),判定不可能是11/120(9%)。這比按NN單獨(dú)判定,錯誤的解答減少到1/5,判定不可能減少到1/3。人們考慮到也判斷含有難判斷的文字圖形時,判斷力能比以往技術(shù)有相當(dāng)?shù)奶岣摺?br> 又,前述實(shí)施例關(guān)于文字識別說明了,若對該分別的屬性選擇有效的特征量、形成成員函數(shù)、進(jìn)行模糊推理,則一定能廣泛應(yīng)用到不限于文字的識別中。又,在前述實(shí)施例中,網(wǎng)格數(shù)據(jù)以二進(jìn)制數(shù)據(jù)處理后,在網(wǎng)格數(shù)據(jù)中若由濃淡值選擇有效的特征量,則能適用。又,在前述實(shí)施例中,從標(biāo)準(zhǔn)化后的網(wǎng)格數(shù)據(jù)提取特征量,若從標(biāo)準(zhǔn)化前的數(shù)據(jù)選擇有效的特征量,則不必要進(jìn)行標(biāo)準(zhǔn)化。又,不限以-1.0~1.0作為推定值的范圍。又,特征量的數(shù)目也不受限定。又,與NN組合時的判定閥值也可適當(dāng)?shù)卦O(shè)定。又,在前述實(shí)施例中,根據(jù)模糊推理判定時增加NN輸出數(shù)據(jù),在NN中僅進(jìn)行文字選擇,在模糊推理時可以不考慮NN的輸出數(shù)據(jù)。又,考慮到NN的輸出數(shù)據(jù),也可以對應(yīng)于判別對象任意設(shè)定其乘數(shù)。
又,作為本發(fā)明對象的輸入圖形,例如是半導(dǎo)體母片和液晶板上的識別號碼及集成電路芯片上的制造號碼等,且不限于從電視攝像機(jī)攝像圖像中獲得的對象物上的文字和記號和模樣等圖形。
根據(jù)本發(fā)明的屬性判定方法,由前述說明表明,比較從多數(shù)標(biāo)準(zhǔn)圖形求得的復(fù)數(shù)特征數(shù)據(jù)的成員函數(shù)和輸入數(shù)據(jù)的復(fù)數(shù)特征數(shù)據(jù),求得對于全部標(biāo)準(zhǔn)圖形的關(guān)于全部特征量的成員函數(shù)輸出值的綜合值,進(jìn)行判別綜合值最高的標(biāo)準(zhǔn)圖形的屬性判別,根據(jù)適當(dāng)?shù)卦O(shè)定其特征數(shù)據(jù),能提高屬性判定的正答率,能做可靠性高的屬性判定。又,因處理非常單純,即使特征數(shù)據(jù)的數(shù)目相當(dāng)多也不會有處理時間和處理容量等問題。又,比較以往的神經(jīng)網(wǎng)絡(luò),判定方法的組合是明確的,因能做必要的特征數(shù)據(jù)的組合,根據(jù)特征數(shù)據(jù)的補(bǔ)充和變更,有能進(jìn)一步確切的屬性判定且能比較容易地進(jìn)行能力改善等效果。
又,鑒于即使神經(jīng)網(wǎng)絡(luò)精細(xì)的判別中遇到問題,用粗糙判別也有效果,用預(yù)定的神經(jīng)網(wǎng)絡(luò)進(jìn)行類似度高的標(biāo)準(zhǔn)圖形的判定,選擇上位的復(fù)數(shù)個標(biāo)準(zhǔn)圖形,用選擇的標(biāo)準(zhǔn)圖形以前述方法進(jìn)行判別時,在較少數(shù)據(jù)處理中能進(jìn)行可靠性高的判別的同時,也有特征數(shù)據(jù)的選定也變得簡單的效果。
又,預(yù)定使用根據(jù)神經(jīng)網(wǎng)絡(luò)判定的情況中,在屬性判定時考慮神經(jīng)網(wǎng)絡(luò)的輸出值時,能進(jìn)一步做可靠性高的判別。
又,在標(biāo)準(zhǔn)圖形的特征數(shù)據(jù)輸入的情況,輸出成員函數(shù)最大值,對其前后的特征數(shù)據(jù),按較小的值被輸出設(shè)定,能識別類似圖形進(jìn)行精度高的判別。
又,進(jìn)行文字判別時,以網(wǎng)格圖形為輸入圖形,根據(jù)用作為特征數(shù)據(jù)的上下縱結(jié)構(gòu)向量和、左右橫結(jié)構(gòu)向量和、上下和左右的面積差、上下交叉次數(shù),能確切地識別文字持有的特征,并以高正確解答率判別文字。
權(quán)利要求
1.一種屬性判定方法,其特征在于包括比較輸入圖像包含的輸入圖形的復(fù)數(shù)的特征數(shù)據(jù)和從多數(shù)的標(biāo)準(zhǔn)圖形中求得的特征數(shù)據(jù)的成員函數(shù),在輸入圖形中判定類似度最高的標(biāo)準(zhǔn)圖形的屬性判定方法,對全部特征數(shù)據(jù)求得對于輸入圖形各特征數(shù)據(jù)的各成員函數(shù)的輸出值,求得對于全部特征數(shù)據(jù)的輸出值的綜合值,對應(yīng)該判定的各標(biāo)準(zhǔn)圖形,判別綜合值最高的標(biāo)準(zhǔn)圖形的屬性判定方法。
2.一種屬性判定方法,其特征在于包括對于輸入圖像包含的輸入圖形,用預(yù)定的神經(jīng)網(wǎng)絡(luò)進(jìn)行類似度高的標(biāo)準(zhǔn)圖形的判定,從其結(jié)果選擇上位的復(fù)數(shù)個的標(biāo)準(zhǔn)圖形,用選擇的標(biāo)準(zhǔn)圖形進(jìn)行權(quán)利要求1中記載的屬性判定方法。
3.一種屬性判定方法,其特征在于包括在綜合值中考慮神經(jīng)網(wǎng)絡(luò)的判定結(jié)果的權(quán)利要求2中記載的屬性判定方法。
4.一種屬性判定方法,其特征在于包括從標(biāo)準(zhǔn)圖形的特征數(shù)據(jù)中作成的成員函數(shù),在其特征數(shù)據(jù)被輸入的情況中輸出大的值,對其前后的特征數(shù)據(jù)設(shè)定輸出小的值的權(quán)利要求1或權(quán)利要求2中記載的屬性判定方法。
5.一種屬性判定方法,其特征在于包括在權(quán)利要求1或權(quán)利要求2或權(quán)利要求3或權(quán)利要求4中記載的屬性判定方法中,以網(wǎng)格圖形為輸入圖形,用合計作為特征數(shù)據(jù)的每列網(wǎng)格圖形數(shù)據(jù)由上往下及由下往上推進(jìn)遇到黑的網(wǎng)格為止的白的網(wǎng)格數(shù)的上下縱結(jié)構(gòu)向量和、合計每行網(wǎng)格圖形數(shù)據(jù)由左往右及由右往左推進(jìn)遇到黑的網(wǎng)格為止的白的網(wǎng)格數(shù)的左右橫結(jié)構(gòu)向量和、求得網(wǎng)格圖形數(shù)據(jù)的上半部分與下半部分及左半部分與右半部分的黑的面積差的上下和左右的面積差以及在中心列的上下方向求得與黑交叉次數(shù)的上下交叉次數(shù),進(jìn)行文字識別。
全文摘要
本發(fā)明揭示一種屬性判定方法,該方法包括比較輸入圖像包含輸入圖形的復(fù)數(shù)的特征數(shù)據(jù)和從標(biāo)準(zhǔn)圖形求得的特征數(shù)據(jù)的成員函數(shù),對于全部的特征數(shù)據(jù)求得對于該輸入圖形的各特征數(shù)據(jù)的各成員函數(shù)的輸出值,并對全部特征數(shù)據(jù)求得輸出值的綜合值,對應(yīng)該判定的多數(shù)的各標(biāo)準(zhǔn)圖形,根據(jù)判別綜合值最高的標(biāo)準(zhǔn)圖形,判定輸入圖形中類似度最高的標(biāo)準(zhǔn)圖形,此方法解決了進(jìn)行正確解答率高且可靠性高的屬性判定問題。
文檔編號G06K9/66GK1144943SQ95106248
公開日1997年3月12日 申請日期1995年6月13日 優(yōu)先權(quán)日1994年6月16日
發(fā)明者湯川典昭, 石井彰一, 手嶋光隆 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1