Открытые данные — различия между версиями
Admin (обсуждение | вклад) м (→= Ссылки) |
Admin (обсуждение | вклад) (→Открытые данные РФ) |
||
Строка 12: | Строка 12: | ||
* [https://ftp.glonass-iac.ru Эфемериды ГЛОНАСС и другие данные спутникового мониторинга] | * [https://ftp.glonass-iac.ru Эфемериды ГЛОНАСС и другие данные спутникового мониторинга] | ||
* API карт Росреестра ([https://maps.rosreestr.ru/arcgis/rest/services 1]) ([https://nsdi.ru/arcgis/rest/services 2]) | * API карт Росреестра ([https://maps.rosreestr.ru/arcgis/rest/services 1]) ([https://nsdi.ru/arcgis/rest/services 2]) | ||
+ | |||
+ | == Открытые данные международных компаний == | ||
+ | * Microsoft | ||
+ | ** [https://www.microsoft.com/en-us/research/academic-program/data-science-at-microsoft-research/ Microsoft Research dataset directory] - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение) | ||
+ | ** [http://mscoco.org/ Microsoft COCO] - база изображений с распознанными объектами на них. | ||
+ | ** [https://archive.ics.uci.edu/ml/datasets/Anonymous+Microsoft+Web+Data Anonymous Microsoft Web Data Data Set] - логи сайта Microsoft.com с 1998 года | ||
+ | ** [http://www.msmarco.org/ Microsoft MAchine Reading COmprehension Dataset] - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами. | ||
+ | * Google | ||
+ | ** [http://storage.googleapis.com/books/ngrams/books/datasetsv2.html Google Ngram dataset] - набор данных Ngram | ||
+ | ** [https://snap.stanford.edu/data/web-Google.html Google Webgraph] - граф веб-страниц и ссылок между ними, опубликован в 2002 году | ||
+ | ** [https://github.com/openimages/dataset Google Open Images] - примерно 9 миллионов URL картинок с аннотациями, рассортированные на 6000 категорий | ||
+ | ** [http://commondatastorage.googleapis.com/books/syntactic-ngrams/index.html Google Syntactic N-grams] - Ngram, составленный по текстам английских книг | ||
+ | ** [https://developers.google.com/freebase/ FreeBase] - коллаборативная [[база знаний]] с API | ||
+ | * Yahoo | ||
+ | ** [https://webscope.sandbox.yahoo.com/ Webscope datasets] - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data) | ||
+ | * Facebook | ||
+ | ** [https://lists.ufl.edu/cgi-bin/wa?A2=ind1102&L=SOCNET&T=0&P=22841 SOCNET Archives] - датасет по связям 100 колледжей и университетов США от 2005 года | ||
+ | * Intel | ||
+ | ** [http://istc-bigdata.org/index.php/our-research-data-sets/ Intel Science and Technology Center for Big Data] - коллекция датасетов исследовательской лаборатории Intel | ||
+ | * Amazon | ||
+ | ** [http://webdatacommons.org/ Web data commons] - открытые данные на базе данных Common Crawl | ||
== Журналистика данных == | == Журналистика данных == |
Версия 00:50, 7 февраля 2017
Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля. Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается открытым, даже если он выложен в машиночитаемом виде в Интернет.
Содержание
Открытые данные РФ
- Веб-сервисы Банка России
- API Государственной Думы
- Каталог на сайте Административной реформы
- Портал открытых данных г. Москва
- Открытые данные г. Кострома
- Хаб открытых данных
- ГосЗатраты - API ГосЗакупок
- Федеральная информационная адресная система
- Эфемериды ГЛОНАСС и другие данные спутникового мониторинга
- API карт Росреестра (1) (2)
Открытые данные международных компаний
- Microsoft
- Microsoft Research dataset directory - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение)
- Microsoft COCO - база изображений с распознанными объектами на них.
- Anonymous Microsoft Web Data Data Set - логи сайта Microsoft.com с 1998 года
- Microsoft MAchine Reading COmprehension Dataset - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами.
- Google
- Google Ngram dataset - набор данных Ngram
- Google Webgraph - граф веб-страниц и ссылок между ними, опубликован в 2002 году
- Google Open Images - примерно 9 миллионов URL картинок с аннотациями, рассортированные на 6000 категорий
- Google Syntactic N-grams - Ngram, составленный по текстам английских книг
- FreeBase - коллаборативная база знаний с API
- Yahoo
- Webscope datasets - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data)
- Facebook
- SOCNET Archives - датасет по связям 100 колледжей и университетов США от 2005 года
- Intel
- Intel Science and Technology Center for Big Data - коллекция датасетов исследовательской лаборатории Intel
- Amazon
- Web data commons - открытые данные на базе данных Common Crawl
Журналистика данных
Журналистика данных (Data journalism) - направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником.