Я пытаюсь проанализировать количество ПРОСМОТРОВ для вопросов о переполнении стека с течением времени. Мне просто нужно несколько снимков (например, ежеквартально) за последние 1-2 года, чтобы продемонстрировать, как со временем меняется спрос на «ответы» в различных технологиях.

enter image description here

Кто-нибудь знает, можно ли получить доступ к историческим версиям общедоступного набора данных в BigQuery? Google должен отслеживать эти базы данных по мере их изменения и развития с течением времени.

BigQuery размещает актуальный набор данных StackOverflow. Хотя это позволяет анализировать, когда задаются вопросы и когда на них отвечают, они не говорят вам, как количество просмотров меняется с течением времени. Я также изучал использование значков и даты их присуждения как средства оценки изменений в количестве просмотров, но это слишком грубо.

В Интернет-архиве есть один дамп данных из Stack Exchange (март 2018 г.), но этого опять же недостаточно!

1
Semaj 13 Ноя 2018 в 14:55

1 ответ

Лучший ответ

Вам повезло, у меня есть идеальный ответ на этот вопрос: да.

Проверьте: https: // todatascience. com / these-are-the-real-stack-overflow-Trends-use-the-pageviews-c439903cd1a

Чтобы запросить мои архивы, вы можете сделать что-то вроде:

#standardSQL
WITH historic_views AS (
  SELECT *, '201703' q
  FROM `fh-bigquery.stackoverflow_archive.201703_posts_questions` 
  UNION ALL
  SELECT *, '201706' q 
  FROM `fh-bigquery.stackoverflow_archive.201706_posts_questions` 
  UNION ALL
  SELECT *,  '201709' q 
  FROM `fh-bigquery.stackoverflow_archive.201709_posts_questions` 
  UNION ALL
  SELECT *, '201712' q 
  FROM `fh-bigquery.stackoverflow_archive.201712_posts_questions` 
  UNION ALL
  SELECT *, '201803' q 
  FROM `fh-bigquery.stackoverflow_archive.201803_posts_questions` 
  UNION ALL
  SELECT *, '201806' q 
  FROM `fh-bigquery.stackoverflow_archive.201806_posts_questions` 
)
1
Felipe Hoffa 13 Ноя 2018 в 19:49