Открытые данные
Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля. Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается открытым, даже если он выложен в машиночитаемом виде в Интернет.
Содержание
Открытые данные РФ
- Веб-сервисы Банка России
- API Государственной Думы
- Каталог на сайте Административной реформы
- Портал открытых данных г. Москва
- Открытые данные г. Кострома
- Хаб открытых данных
- ГосЗатраты - API ГосЗакупок
- Федеральная информационная адресная система
- Эфемериды ГЛОНАСС и другие данные спутникового мониторинга
- API карт Росреестра (1) (2)
Открытые данные международных компаний
- Microsoft
- Microsoft Research dataset directory - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение)
- Microsoft COCO - база изображений с распознанными объектами на них.
- Anonymous Microsoft Web Data Data Set - логи сайта Microsoft.com с 1998 года
- Microsoft MAchine Reading COmprehension Dataset - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами.
- Google
- Google Ngram dataset - набор данных Ngram
- Google Webgraph - граф веб-страниц и ссылок между ними, опубликован в 2002 году
- Google Open Images - примерно 9 миллионов URL картинок с аннотациями, рассортированные на 6000 категорий
- Google Syntactic N-grams - Ngram, составленный по текстам английских книг
- FreeBase - коллаборативная база знаний с API
- Yahoo
- Webscope datasets - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data)
- Facebook
- SOCNET Archives - датасет по связям 100 колледжей и университетов США от 2005 года
- Intel
- Intel Science and Technology Center for Big Data - коллекция датасетов исследовательской лаборатории Intel
- Amazon
- Web data commons - открытые данные на базе данных Common Crawl
Журналистика данных
Журналистика данных (Data journalism) - направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником.