Сделали систему, которая чистит «грязные» данные в таблицах

Напачкают, потом убирай за ними.

Сделали систему, которая чистит «грязные» данные в таблицах

😢 Проблема: очистка данных в таблицах может занять четверть рабочего времени аналитика. Автоматизировать эту задачу сложно, потому что для разных наборов данных требуются разные типы очистки. Кроме того, часто необходимо рассуждать об объектах, опираясь на кругозор, которого нет у нейросетей.

😎 Решение: PClean — система, которая сочетает знания о предметной области с базовым уровнем практических суждений для автоматической очистки баз данных от миллионов записей. Она автоматически убирает опечатки, повторы, пропущенные значения, орфографические ошибки и несоответствия в данных. 

Пользователь предоставляет системе базовые знания о предмете и информацию о возможных ошибках, а PClean объединяет эти знания с помощью вероятностных рассуждений и наводит в данных порядок. Технология упрощает и удешевляет объединение беспорядочных несовместимых баз данных в чистые записи.

👨‍🔬 Кто: инженеры Массачусетского технологического института.

Источник: Tech Xplore

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно
«Браслет тишины» запретит смарт-устройствам подслушивать
«Браслет тишины» запретит смарт-устройствам подслушивать

Так им!

«Алиса» научилась расшифровывать и переводить текст
«Алиса» научилась расшифровывать и переводить текст

Не только говорит, но и делает.

«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн
«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн

ВКонтакте проводит конкурс приложений, созданных на платформе VK Mini Apps.

Российские учёные разработали экологичный многоразовый сорбент для очистки сточных вод от антибиотиков
Российские учёные разработали экологичный многоразовый сорбент для очистки сточных вод от антибиотиков
Чат-бот Facebook учит сотрудников отвечать на вопросы о скандалах компании
Чат-бот Facebook учит сотрудников отвечать на вопросы о скандалах компании

Настало время упоительных историй.

Сделали самую маленькую птицу-оригами в мире
Сделали самую маленькую птицу-оригами в мире

Оригами-роботы.

Учёные хотят напечатать ядерный реактор на 3D-принтере
Учёные хотят напечатать ядерный реактор на 3D-принтере

Каждому по реактору.

Умную колонку научили чревовещанию
Умную колонку научили чревовещанию

Если очень хочется говорящий кактус.

Прогресс: огромная квантовая память для ИИ
Прогресс: огромная квантовая память для ИИ