ОЦЕНКА ИНФОРМАТИВНОСТИ И ОТБОР ПРИЗНАКОВ ПРИ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ МИКРОСКОПИЧЕСКИХ ПРЕПАРАТОВ, ОКРАШЕННЫХ ПО МЕТОДУ ЦИЛЯ-НИЛЬСЕНА
Аннотация
Цель. Оценка информативности и осуществление отбора признаков для классификации объектов, на цифровых изображениях микроскопических препаратов, окрашенных по методу Циля-Нильсена с помощью методов Шеннона и Кульбака, а также сравнение результатов их применения.
Материалы и методы. Использовались данные о 343 687 объектах, выделенных на цифровых изображениях микроскопических препаратов: 6 708 объектов – кислотоустойчивые микобактерии, 336 979 – иные объекты. Анализ объектов производился по 240 цветовым и морфометрическим признакам, оценка информативности которых осуществлялась с помощью методов Шеннона и Кульбака. Оценка качества отбора признаков осуществлялась с применением наивного Байесовского классификатора.
Результаты. Наибольшую информативность по методу Шеннона имели цветовые признаки объектов и соотношения их размеров, а наибольшая доля верно классифицированных объектов (84,6%) была достигнута при включении в классификационную модель 6 признаков с наибольшей информативностью по методу Шеннона. Наибольшую информативность по методу Кульбака имели радиальные размеры объектов и их соотношения, а наибольшая доля верно классифицированных объектов (78,0%) была достигнута при включении в классификационную модель 14 признаков с наибольшей информативностью по методу Кульбака.
Заключение. Методы Шеннона и Кульбака могут применяться для снижения признакового пространства при классификации объектов. Метод Шеннона позволяет в большей мере сократить количество признаков, обеспечивая при этом наибольшую долю верной классификации объектов.
Ключевые слова
Полный текст:
>PDFЛитература
Kaplan A., Lock E.F. Prediction with dimension reduction of multiple molecular data sources for patient survival. Cancer informatics, 2017, № 16, e1176935117718517.
Birjandtalab J., Baran Pouyan M., Cogan D., Nourani M., Harvey J. Automated seizure detection using limited-channel EEG and non-linear dimension reduction. Computers in biology and medicine, 2017, № 82, pp. 49–58.
Xu K., Guo W., Xiong M., Zhu L., Jin L. An estimating equation approach to dimension reduction for longitudinal data. Biometrika, 2016, № 1, pp. 189–203.
Loseva E.D., Sergienko R.B. O metodakh otbora informativnykh priznakov s privlecheniem samoorganizuyushchikhsya neyrosetevykh klassifikatorov i ikh ansambley [On the methods of selection of informative signs with the involvement of a self-organizing neural network classifiers and their ensembles]. Vestnik Sibirskogo gosudarstvennogo aerokosmicheskogo universiteta im. akademika M.F. Reshetneva [Bulletin of Siberian state aerospace University. academician M. F. Reshetnev], 2016, № 4, pp. 878-882.
Leont’eva L.N. Posledovatel’nyy vybor priznakov pri vosstanovlenii regressii [Sequential feature selection when restoring a regression]. Mashinnoe obuchenie i analiz dannykh [Machine learning and data analysis], 2012, № 3, pp. 335–346.
Popkov A.V., Nastenko E.A. Mnogokriterial’nyy algoritm poshagovogo otbora priznakov pri vosstanovlenii regressii [Multicriteria algorithm step-by-step selecting features when restoring a regression]. Innovatsionnye tekhnologii v nauke i obrazovanii [Innovative technologies in science and education], 2015, № 1, pp. 267–268.
Gulin V.V. Metody snizheniya razmernosti priznakovogo opisaniya dokumentov v zadache klassifikatsii tekstov [Methods of reducing the dimension of feature vectors describing the documents in the task of text classification]. Vestnik MEI [Bulletin of MEI], 2013, № 2, pp. 115–121.
Myasnikov E.V. Analiz metodov snizheniya razmernosti v zadache predstavleniya kollektsiy tsifrovykh izobrazheniy [Analysis of methods for dimensionality reduction in the representation of collections of digital images]. Komp’yuternaya optika [Computer optics], 2008, № 3, pp. 296–301.
Liu Y., Chiaromonte F., Li B. Structured Ordinary Least Squares: A Sufficient Dimension Reduction approach for regressions with partitioned predictors and heterogeneous units. Biometrics, 2017, № 2, pp. 529–539.
Gritsinskaya V.L., Moskalenko O.L. Ispol’zovanie komp’yuternykh tekhnologiy pri provedenii dispanserizatsii detskogo naseleniya Respubliki Tyva [The use of computer technologies at carrying out of prophylactic medical examination of children of the Republic of Tuva] // V mire nauchnykh otkrytiy [In the world of scientific discoveries]. 2017. № 2, pp. 158–167.
Gaydel’ A.V., Krasheninnikov V.R. Otbor priznakov dlya zadachi diagnostiki osteoporoza po rentgenovskim izobrazheniyam sheyki bedra [The selection of features to the diagnosis of osteoporosis at x-ray images of the femoral neck]. Komp’yuternaya optika [Computer optics], 2016, № 6, pp. 939–946.
Tu Y., Tan A., Fu Z., Sam Hung Y., Hu L., Zhang Zh. Supervised nonlinear dimension reduction of functional magnetic resonance imaging data using Sliced Inverse Regression. Conference proceedings: 37th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, Milan, 2015, pp. 2641–2645.
Ivan G., Grolmusz V. On dimension reduction of clustering results in structural bioinformatics. Biochimica et biophysica acta, 2014, № 12, pp. 2277–2283.
Narkevich A.N. Algoritmy segmentatsii tsifrovykh mikroskopicheskikh izobrazheniy mokroty, okrashennoy po metodu Tsilya-Nil’sena [Algorithms for segmenting digital microscopic images of sputum stained by the method of Ziehl-Nielsen]. World Science: Proceedings of articles the international scientific conference, Kirov: MCNIP LLC, 2017, pp. 431–436.
Shennon K. Raboty po teorii informatsii i kibernetike [Works on information theory and Cybernetics], Moscow: Inostrannaya literatura, 1963, 832 p.
Bykova V.V., Kataeva A.V. Metody i sredstva analiza informativnosti priznakov pri obrabotke meditsinskikh dannykh [Methods and means of analysis of the informative signs in the processing of medical data]. Programmnye produkty i sistemy [Software products and systems], 2016, № 2, pp. 172–178.
Kul’bak S. Teoriya informatsii i statistika [Information theory and statistics], Moscow: Nauka, 1967, 408 p.
L’vovich I.Ya., Gladskikh N.A., Kaz’mina I.V. Algoritmicheskoe obespechenie veroyatnostnoy otsenki retsidiva insul’ta s ispol’zovaniem metodiki formirovaniya slovarya informativnykh priznakov na osnove kriteriya Kul’baka [Algorithmic support for probabilistic assessment of recurrence of stroke with the use of the method of forming a vocabulary of informative features based on the Kullback criterion]. Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta [Vestnik Voronezh state technical University], 2009, № 9, pp. 56–57.
Shlykova E.A., Esaulenko I.E., Kosolapov V.P., Gladskikh N.A. Matematicheskoe i algoritmicheskoe obespechenie rascheta mediko-sotsial’nykh priznakov zabolevaniy tkaney parodonta u vzroslogo naseleniya [Mathematical and algorithmic support of calculation of health and social signs of periodontal diseases among the adult population]. Sistemnyy analiz i upravlenie v biomeditsinskikh sistemakh [System analysis and management in biomedical systems], 2014, № 4, pp. 947–951.
Zagoruyko N.G. Prikladnye metody analiza dannykh i znaniy [Applied methods of data and knowledge analysis], Novosibirsk: Izdatel’stvo IM SO RAN, 1999, 270 p.
Ayvazyan S.A., Bukhshtaber V.M., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika: Klassifikatsiya i snizhenie razmernosti: spravochnik [Applied statistics: Classification and reduction of dimensionality: Handbook], Moscow: Finansy i statistika, 1989, 250 p.
Sturges H. The choice of a class-interval. Journal of the American Statistical Association, 1926, № 21, pp. 65–66.
DOI: https://doi.org/10.12731/wsd-2017-4-106-121
Ссылки
- На текущий момент ссылки отсутствуют.
(c) 2017 Artem Nikolaevich Narkevich, Konstantin Anatol’evich Vinogradov, Mikhaylovna Nataliya Koretskaya, Alina Vladimirovna Kataeva, Ekaterina Olegovna Zhurbenko
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
ISSN 2658-6649 (print)
ISSN 2658-6657 (online)