簡介
基于監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法需要大量數(shù)據(jù)作為輸入,模型完全由數(shù)據(jù)驅(qū)動,其數(shù)據(jù)質(zhì)量是算法有效的必要條件,所以如何高效的采集到數(shù)據(jù),以及正確的標(biāo)注或分析是極其重要的,如果第一步有問題,后續(xù)的所有工作都是徒勞。
本文將介紹 PECC 的數(shù)據(jù)采集板,以及來自 GPM China 的數(shù)據(jù)采集工具,簡單分析數(shù)據(jù)質(zhì)量的一些方法,以及需要注意的一些事項。
上位機(jī)介紹
總結(jié)
數(shù)據(jù)采集和標(biāo)注是做好神經(jīng)網(wǎng)絡(luò)的第一步,需要格外小心和謹(jǐn)慎,不然其中有臟數(shù)據(jù),通過肉眼十分難以清理出來,臟數(shù)據(jù)過多會導(dǎo)致模型泛化能力很差。
其中一個辦法是用模型對所有數(shù)據(jù)進(jìn)行驗證,然后挑選出驗證結(jié)果失敗的數(shù)據(jù),然后 Plot出來。若通過肉眼分辨,其工作量非常巨大和繁瑣,還是應(yīng)當(dāng)在數(shù)據(jù)收集的過程中保證數(shù)據(jù)的有效性。