Открытые данные — различия между версиями
Admin (обсуждение | вклад) (→Открытые данные РФ) |
Admin (обсуждение | вклад) м (→Открытые данные международных компаний) |
||
Строка 14: | Строка 14: | ||
== Открытые данные международных компаний == | == Открытые данные международных компаний == | ||
− | * Microsoft | + | * '''Microsoft''' |
** [https://www.microsoft.com/en-us/research/academic-program/data-science-at-microsoft-research/ Microsoft Research dataset directory] - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение) | ** [https://www.microsoft.com/en-us/research/academic-program/data-science-at-microsoft-research/ Microsoft Research dataset directory] - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение) | ||
** [http://mscoco.org/ Microsoft COCO] - база изображений с распознанными объектами на них. | ** [http://mscoco.org/ Microsoft COCO] - база изображений с распознанными объектами на них. | ||
** [https://archive.ics.uci.edu/ml/datasets/Anonymous+Microsoft+Web+Data Anonymous Microsoft Web Data Data Set] - логи сайта Microsoft.com с 1998 года | ** [https://archive.ics.uci.edu/ml/datasets/Anonymous+Microsoft+Web+Data Anonymous Microsoft Web Data Data Set] - логи сайта Microsoft.com с 1998 года | ||
** [http://www.msmarco.org/ Microsoft MAchine Reading COmprehension Dataset] - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами. | ** [http://www.msmarco.org/ Microsoft MAchine Reading COmprehension Dataset] - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами. | ||
− | * Google | + | * '''Google''' |
** [http://storage.googleapis.com/books/ngrams/books/datasetsv2.html Google Ngram dataset] - набор данных Ngram | ** [http://storage.googleapis.com/books/ngrams/books/datasetsv2.html Google Ngram dataset] - набор данных Ngram | ||
** [https://snap.stanford.edu/data/web-Google.html Google Webgraph] - граф веб-страниц и ссылок между ними, опубликован в 2002 году | ** [https://snap.stanford.edu/data/web-Google.html Google Webgraph] - граф веб-страниц и ссылок между ними, опубликован в 2002 году | ||
Строка 25: | Строка 25: | ||
** [http://commondatastorage.googleapis.com/books/syntactic-ngrams/index.html Google Syntactic N-grams] - Ngram, составленный по текстам английских книг | ** [http://commondatastorage.googleapis.com/books/syntactic-ngrams/index.html Google Syntactic N-grams] - Ngram, составленный по текстам английских книг | ||
** [https://developers.google.com/freebase/ FreeBase] - коллаборативная [[база знаний]] с API | ** [https://developers.google.com/freebase/ FreeBase] - коллаборативная [[база знаний]] с API | ||
− | * Yahoo | + | * '''Yahoo''' |
** [https://webscope.sandbox.yahoo.com/ Webscope datasets] - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data) | ** [https://webscope.sandbox.yahoo.com/ Webscope datasets] - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data) | ||
− | * Facebook | + | * '''Facebook''' |
** [https://lists.ufl.edu/cgi-bin/wa?A2=ind1102&L=SOCNET&T=0&P=22841 SOCNET Archives] - датасет по связям 100 колледжей и университетов США от 2005 года | ** [https://lists.ufl.edu/cgi-bin/wa?A2=ind1102&L=SOCNET&T=0&P=22841 SOCNET Archives] - датасет по связям 100 колледжей и университетов США от 2005 года | ||
− | * Intel | + | * '''Intel''' |
** [http://istc-bigdata.org/index.php/our-research-data-sets/ Intel Science and Technology Center for Big Data] - коллекция датасетов исследовательской лаборатории Intel | ** [http://istc-bigdata.org/index.php/our-research-data-sets/ Intel Science and Technology Center for Big Data] - коллекция датасетов исследовательской лаборатории Intel | ||
− | * Amazon | + | * '''Amazon''' |
** [http://webdatacommons.org/ Web data commons] - открытые данные на базе данных Common Crawl | ** [http://webdatacommons.org/ Web data commons] - открытые данные на базе данных Common Crawl | ||
Текущая версия на 00:50, 7 февраля 2017
Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля. Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается открытым, даже если он выложен в машиночитаемом виде в Интернет.
Содержание
Открытые данные РФ
- Веб-сервисы Банка России
- API Государственной Думы
- Каталог на сайте Административной реформы
- Портал открытых данных г. Москва
- Открытые данные г. Кострома
- Хаб открытых данных
- ГосЗатраты - API ГосЗакупок
- Федеральная информационная адресная система
- Эфемериды ГЛОНАСС и другие данные спутникового мониторинга
- API карт Росреестра (1) (2)
Открытые данные международных компаний
- Microsoft
- Microsoft Research dataset directory - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение)
- Microsoft COCO - база изображений с распознанными объектами на них.
- Anonymous Microsoft Web Data Data Set - логи сайта Microsoft.com с 1998 года
- Microsoft MAchine Reading COmprehension Dataset - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами.
- Google
- Google Ngram dataset - набор данных Ngram
- Google Webgraph - граф веб-страниц и ссылок между ними, опубликован в 2002 году
- Google Open Images - примерно 9 миллионов URL картинок с аннотациями, рассортированные на 6000 категорий
- Google Syntactic N-grams - Ngram, составленный по текстам английских книг
- FreeBase - коллаборативная база знаний с API
- Yahoo
- Webscope datasets - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data)
- Facebook
- SOCNET Archives - датасет по связям 100 колледжей и университетов США от 2005 года
- Intel
- Intel Science and Technology Center for Big Data - коллекция датасетов исследовательской лаборатории Intel
- Amazon
- Web data commons - открытые данные на базе данных Common Crawl
Журналистика данных
Журналистика данных (Data journalism) - направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником.