НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Чем копать Большие данные?

Изучаем инструментарий программиста для Big Data.

[spoiler]KDNuggets опубликовала ежегодный топ лучших языков программирования для задач аналитики, раскопки данных и научных исследований, основанный на опросе 700 профильных разработчиков (допускались множественные ответы).

Стабильно наращивает свое преимущество язык R r-project.org (уже 60+%), следом за ним так же уверенно держится Python (39%), и где-то рядом SQL (37%). Мэйнстримовский язык запросов SQL смотрится в этой компании немного странновато, хотя понятно, что он прост для изучения, а многие сервисы предлагают доступ к облачным массивам информации прямыми SQL-запросами из браузера. Заметно теряет свою популярность Java, да и другие универсальные языки. Довольно неожиданно ушёл в даун Clojure, аж на 77% спад, Perl и Ruby (-50%). Хотя среди тех, кто активно использует R, доля клож-разработчиков увеличилась на 41%.
А вот языки, прямо или косвенно связанные с платформой Hadoop, подросли в среднем на 19%.

R конечно довольно необычен, так как создавался двумя профессорами для собственных нужд -- матричных и статистических вычислений, но современная его версия отлично распараллеливается, включает множество фишек для мультисерверной, многоядерной и многопотоковой работы, поддерживает кластеры Hadoop, представляя при этом из себя причудливый микс из системы запросов к БД, статистических расчетов, весьма продвинутой аналитики, математических алгоритмов итд. В последней версии 3.0 -- работа с длинными векторами (2^31-1 элементов) и поддержка 64-разрядных целых чисел.