В рамките на първото за Централна и Източна Европа практическо предизвикателство за обработка и анализ на данни Datathon компанията за семантичен софтуер "Онтотекст" предизвиква участниците да преобразуват публично достъпните данни от Търговския регистър във формат отворени и свързани данни (Linked Open Data – LOD).
Целта на заданието "Да хакнем Търговския регистър" ще бъде екипите да разкрият връзки и скрити факти в масив с ненормализирани данни. Така например участниците биха могли да идентифицират и класифицират най-големите групи от свързани фирми в България или в определен район от страната. Друга възможност за екипите би била чрез данните от Търговския регистър и свързването им с други отворени източници да анализират как съвместното участие на директори в бордове на различни фирми се отразява на сферите им на влияние.
По време на Datathon "Онтотекст" ще предостави на участниците част от информацията от Търговския регистър между 2008 и 2017 г., а с помощта на ментори те ще работят върху превръщането им в отворени данни и свързването им с други. За по-добра подготовка една седмица преди събитието от компанията предоставят на екипите обучителни видеоматериали. На тазгодишния Datathon "Онтотекст" допълнително ще си партнира с компанията OpenCorporates, която предоставя отворена база данни от компании и бизнес информация по света.
За събитието
Практическото предизвикателство Datathon Bulgaria се организира от българската организация Data Science Society и ще се проведе между 24 и 26 март в "СофтУни".
Целта на събитието е да събере на едно място професионалисти от различни сфери - програмиране, анализ на данни, алгоритми и др. Участниците в събитието ще сформират екипи, а задачите им ще бъдат поставяни от различни български технологични компании, като тяхната цел ще бъде да разработят решение, базирано на реални данни.
Компаниите, които участват в тазгодишния Datathon, са: Experian Bulgaria, Hyperscience, Receipt Bank, GemSeek, Vmware, "Онтотекст", "Кауфланд", "Теленор", SAP, A4E и ShopUp. Всяка една от тях има предварително зададен казус, а в рамките на събитието участниците ще трябва да предложат технологично решение.