Открытые данные — различия между версиями

(Журналистика данных)
м (Открытые данные международных компаний)
 
(не показаны 3 промежуточные версии этого же участника)
Строка 12: Строка 12:
 
* [https://ftp.glonass-iac.ru Эфемериды ГЛОНАСС и другие данные спутникового мониторинга]
 
* [https://ftp.glonass-iac.ru Эфемериды ГЛОНАСС и другие данные спутникового мониторинга]
 
* API карт Росреестра ([https://maps.rosreestr.ru/arcgis/rest/services 1]) ([https://nsdi.ru/arcgis/rest/services 2])
 
* API карт Росреестра ([https://maps.rosreestr.ru/arcgis/rest/services 1]) ([https://nsdi.ru/arcgis/rest/services 2])
 +
 +
== Открытые данные международных компаний ==
 +
* '''Microsoft'''
 +
** [https://www.microsoft.com/en-us/research/academic-program/data-science-at-microsoft-research/ Microsoft Research dataset directory] - различные наборы данных для исследований (жесты, изображения, семантические карты, геолокации, NLP, компьютерное зрение)
 +
** [http://mscoco.org/ Microsoft COCO] - база изображений с распознанными объектами на них.
 +
** [https://archive.ics.uci.edu/ml/datasets/Anonymous+Microsoft+Web+Data Anonymous Microsoft Web Data Data Set] - логи сайта Microsoft.com с 1998 года
 +
** [http://www.msmarco.org/ Microsoft MAchine Reading COmprehension Dataset] - 100 тысяч запросов из поисковика Bing и помощника Cortana с ответами.
 +
* '''Google'''
 +
** [http://storage.googleapis.com/books/ngrams/books/datasetsv2.html Google Ngram dataset] -  набор данных Ngram
 +
** [https://snap.stanford.edu/data/web-Google.html Google Webgraph] - граф веб-страниц и ссылок между ними, опубликован в 2002 году
 +
** [https://github.com/openimages/dataset Google Open Images] - примерно 9 миллионов URL картинок с аннотациями, рассортированные на 6000 категорий
 +
** [http://commondatastorage.googleapis.com/books/syntactic-ngrams/index.html Google Syntactic N-grams] - Ngram, составленный по текстам английских книг
 +
** [https://developers.google.com/freebase/  FreeBase] - коллаборативная [[база знаний]] с API
 +
* '''Yahoo'''
 +
** [https://webscope.sandbox.yahoo.com/ Webscope datasets] - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data)
 +
* '''Facebook'''
 +
** [https://lists.ufl.edu/cgi-bin/wa?A2=ind1102&L=SOCNET&T=0&P=22841 SOCNET Archives] - датасет по связям 100 колледжей и университетов США от 2005 года
 +
* '''Intel'''
 +
** [http://istc-bigdata.org/index.php/our-research-data-sets/ Intel Science and Technology Center for Big Data] - коллекция датасетов исследовательской лаборатории Intel
 +
* '''Amazon'''
 +
** [http://webdatacommons.org/ Web data commons] - открытые данные на базе данных Common Crawl
  
 
== Журналистика данных ==
 
== Журналистика данных ==
 +
'''Журналистика данных''' (Data journalism) - направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником.
 +
 +
=== Ссылки ===
 
* [https://ria.ru/files/book/_site/ Пособие по журналистике данных]
 
* [https://ria.ru/files/book/_site/ Пособие по журналистике данных]
 
* [http://automatingosint.com/blog/ Блог Justin Seitz по автоматизации работы с открытыми данными]
 
* [http://automatingosint.com/blog/ Блог Justin Seitz по автоматизации работы с открытыми данными]

Текущая версия на 00:50, 7 февраля 2017

Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля. Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается открытым, даже если он выложен в машиночитаемом виде в Интернет.

Открытые данные РФ

Открытые данные международных компаний

  • Microsoft
  • Google
  • Yahoo
    • Webscope datasets - библиотека датасетов по разным тематикам (Advertising and Market Data, Competition Data, Computing Systems Data, Graph and Social Data, Image Data, Language Data, Ratings and Classification Data)
  • Facebook
    • SOCNET Archives - датасет по связям 100 колледжей и университетов США от 2005 года
  • Intel
  • Amazon
    • Web data commons - открытые данные на базе данных Common Crawl

Журналистика данных

Журналистика данных (Data journalism) - направление в журналистике, в основе которого лежит обработка данных и их использование для создания журналистского материала. Данные могут служить как инструментом для раскрытия определенной журналистской истории, так и ее источником.

Ссылки

Блоги