Предварительно оценены возможности пилотной модели – классификатора, обученного распознаванию следов микробной деятельности на твердых поверхностях, свидетельствующих о развитии почвоподобных тел. Для машинного обучения собрана база данных объемом 500 образцов, описанных самостоятельно и в открытых источниках в период с 1988 г. по настоящее время; среди них 59 образцов представляли почвенные горизонты, 146 материнские породы и почвоподобные образования, а также породообразующие минералы, сопутствующие компоненты почвообразования, ксенобиотики, распространенные в техногенно преобразованных ландшафтах мира. Образцы вошли в базу данных в вариациях дисперсности, покрытия биопленками и пленками иной природы, химической и физической обработки. Массив значимых для машинного обучения признаков образцов включал квантили распределения контактного угла смачивания и обобщающие категориальные показатели геометрии поверхности, минерального состава, состояния органического вещества. Целевой функцией классификации служило наличие устойчивых следов микробной деятельности на твердой поверхности. Недостающие данные реконструировали с помощью процедур Монте-Карло и случайной перевыборки. В результате численных экспериментов по оптимизации качества обучения получен сбалансированный обучающий набор данных, содержащий 1233 элемента псевдовыборок. Обучено и оценено 6 моделей классификаторов с вариацией параметров. Наиболее производительный классификатор – пятислойная нейронная сеть со случайно отключаемыми нейронами – продемонстрировал на тестовой выборке правильность предсказаний 0.74 и ROC AUC 0.80, что выше, чем у более простых и быстродействующих (правильность и ROC AUC 0.70). На основании несогласия классификаций между экспертом-человеком и обученным алгоритмом установлены общие черты сложных для машинной классификации образцов: со следами жизнедеятельности, карбонатные, дисперсные – что позволяет определить направление сбора информации для повышения производительности классификатора. Разработка алгоритма распознавания следов микробной деятельности полезна для уточнения механизмов почвообразования, биогеохимических и биогеотехнологических процессов в грунтах различного происхождения, в том числе терраформирования.
Индексирование
Scopus
Crossref
Higher Attestation Commission
At the Ministry of Education and Science of the Russian Federation