Андрій Газін: Робота з даними в середовищі R
Як здійснювати базові операції в R, а саме - завантажувати дані, робити різні операції (фільтрувати, обчислювати нові змінні, групувати та робити агрегації), розповів та продемонстрував Андрій Газін, ...
Додано:
Громадський Простір
Як здійснювати базові операції в R, а саме – завантажувати дані, робити різні операції (фільтрувати, обчислювати нові змінні, групувати та робити агрегації), розповів та продемонстрував Андрій Газін, журналіст даних Texty.org.ua під час воркшопу “Робота з даними в середовищі R” Громадянської мережі ОПОРА та TechSoup в рамках проекту Apps4Cities /“Дані міст”. Громадський Простір інформаційно долучився до підтримки цієї ініціативи, вважаємо, що це корисні знання – тому публікуємо запис вокршопу для Бази знань НУО.
R — мова програмування і програмне середовище для статистичних обчислень, аналізу та представлення даних в графічному вигляді, створена у 1993 році, на основі мови програмування S.
R de-facto став стандартом у міжнародній спільноті спеціалістів в галузі статистики, і широко використовується в розробках статистичних програм та аналізі даних. Згідно щорічному опитуванню Rexer's Annual Data Miner Survey в 2010 році, більшість (43%) серед опитаних спеціалістів з аналізу даних використовують у своїй роботі середовище R. (Детальніше).
“Я працюю журналістом даних в Texty.org.ua. Ми переважно займаємося аналізом та візуалізацією даних, і R – це для нас один із основних інструментів в процесі, у першу чергу, аналізу даних, але іноді й візуалізації також. Фактично, більшість проектів так чи інакше включають аналіз даних в R…. це дуже зручно, бо ми можемо обмінюватися кодом, вирішувати спільні задачі і мати спільний “workflow”, – Андрій Газін.
Пропонуємо вам переглянути відео з воркшопу:
Презентація доступна за посиланням.
“Робота з даними в середовищі R” – це другий воркшоп із серії по обробці даних в рамках проекту Apps4Cities /“Дані міст”. Перший воркшоп був присвячений роботі з даними в Calc, Excel, Google.
___________________________
Організатори: Громадянська мережа ОПОРА та TechSoup
За підтримки: Національного фонду на підтримку демократії (NED) та Державного департаменту США.
Інформаційний партнер: Громадський Простір
Про Проект:
Разом з Techsoup ми хочемо попрацювати над тим, щоб цей процес відбувався в Україні правильно та ефективно, щоб різні середовища та команди взялись за розробку і впровадження різноманітних сервісів на базі міських даних. Щоб це сталось ми запланували багато роботи.
Ми хочемо почати з аудитів опублікованих даних міст України, щоб розуміти як іде процес відкриття та провести його якісніше.
Дана робота складається з ряду технічних і аналітичних завдань, таких як: підготовка переліку даних, що знаходяться у власності міста; описується зміст і формат кожного набору даних. Готуються рекомендації щодо подальшого розкриття даних (як за змістом і tech-wise) в рамках публічних консультацій.
Освіта і просвіта
Через серію онлайн і оффлайн зустрічей ми хочемо знайти співтовариства зацікавлених: громадських організацій, громадських активістів, незалежних засобів масової інформації та ін. Ми проведемо навчання по роботі з даними і розкажемо як це приводить до соціальних змін, спочатку в невеликих громадах і потім в усій країні.
Етапи Apps4Cities Challenge
- В середині серпня ми запросимо всіх зацікавлених подавати свої ідеї додатків на конкурс, для первинного відбору.
- В кінці вересня 20 ідей які переможуть на інтернет голосуванні ми запросимо на хакатон, щоб попрацювати разом та створити прототипи.
- До листопада триватиме голосування за кожну із 20 ідей які згодяться працювати далі після хакатону
- Вже в кінці листопада ми разом з інтернет-голосуванням та журі відберемо чотирьох переможців, які отримають призи та пропозицію подальшої інкубації своїх проектів.