Rによる無料データの入手と利用

無料で公開されている社会科学データをRに読み込むためのガイド(2025年4月23日更新)

共通説明

事前準備

新しい(もしくはデータ分析に使う既存の)Rスクリプトファイル準備し、任意の場所に保存しておきます。

その後、データ保存場所のディレクトリを設定します(必要のないコードは消してください)。

## Rスクリプトファイルと同じ場所にする場合
setwd(dirname(rstudioapi::getActiveDocumentContext()$path))

## 自分の好きな場所にする場合
setwd("MY/FAVORITE/FILE/PATH")

データ入手後

データがダウンロードできて、一度読み込みに成功したら、\##データのダウンロード項目に含まれるコードはもう使わないのでコメントアウトして、\##データの読み込みという項目以下にあるコードだけを使用してください。

東大朝日調査(2003-2024)

2003年以降、日本の各国政選挙に対応して行われている有権者と政治家に対する調査です。データとコードブックはこのウェブサイトから公開されています。データの使用に関して、利用許可申請は不要ですが、以下の項目への同意が必要です。

  • 本データの使用は学術目的に限ります。
  • 本データを用いた著作物等を公開される場合は「東大谷口研・朝日調査データを使用した」旨を明記してください。また,1部を「〒113-0033 文京区本郷7-3-1東京大学大学院法学政治学研究科谷口研究室」までお届けください。
  • 本データ・コードブック・報告書の著作権は調査者に属します。許可なき再配布及び転載を禁じます。
  • 本データは随時更新されます。データのダウンロードや分析に関するサポートは行っておりません。

有権者調査

2022年参院選(2023年実施)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2023UTASV20230416.csv",
              "2023UTASV20230416.csv")

## データの読み込み
library(readr)
dt <- read_csv("2023UTASV20230416.csv")
Rows: 1967 Columns: 59
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (1): Prefecture
dbl (58): ID, Q1, Q3_1, Q3_2, Q3_3, Q3_4, Q3_5, Q3_6, Q3_7, Q5, Q6, Q7, Q29,...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$Q47)
   1    2   99 
 909 1026   32 

2021年衆院選(2022年実施)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2022UTASV20220730.csv",
              "2022UTASV20220730.csv")

## データの読み込み
library(readr)
dt <- read_csv("2022UTASV20220730.csv")
Rows: 1892 Columns: 60
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (1): Prefecture
dbl (59): ID, Scale, Q1, Q3_1, Q3_2, Q3_3, Q3_4, Q3_5, Q3_6, Q3_7, Q6, Q8, Q...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$Q43)
  1   2  99 
911 965  16 

2019年参院選(2020年実施)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2020UTASV20210319.csv",
              "2020UTASV20210319.csv")

## データの読み込み
library(readr)
dt <- read_csv("2020UTASV20210319.csv")
Rows: 2053 Columns: 38
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (1): ID
dbl  (36): Term, Scale, Area, PR, Q1, Q3, Q4, Q18, Q20, Q30, Q31, Q32_1, Q32...
date  (1): Date

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$Q37)
   1    2   99 
 945 1084   24 

2017年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2017UTASV20200326.csv",
              "2017UTASV20200326.csv")

## データの読み込み
library(readr)
dt <- read_csv("2017UTASV20200326.csv")
Rows: 1778 Columns: 137
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (14): PREFNAME, CITY, Q2FA, Q4FA, Q5FA, Q6FA, Q8FA, Q13FA, Q18FA, Q19FA...
dbl (123): ID, PREFEC, HRDIST, Q1, Q2, Q3, Q4, Q5_1, Q5_2, Q5_3, Q6_1, Q6_2,...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$F1)
  1   2  99 
851 910  17 

2014年衆院選, 2016年参院選(2波パネル)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2014_2016UTASV20161004.csv",
              "2014_2016UTASV20161004.csv")

## データの読み込み
library(readr)
dt <- read_csv("2014_2016UTASV20161004.csv")
Rows: 1813 Columns: 217
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (19): PREFNAME, CITY, W1Q2FA, W1Q4FA, W1Q5FA, W1Q6FA, W1Q14_2FA, W1Q18F...
dbl (198): ID, PREFEC, HRDIST, W1Q1, W1Q2, W1Q3, W1Q4, W1Q5_1, W1Q5_2, W1Q5_...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$W1F1)
  1   2  99 
845 954  14 

2012年衆院選, 2013年参院選(2波パネル)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2012-2013UTASV131129.csv",
              "2012-2013UTASV131129.csv")

## データの読み込み
library(readr)
dt <- read_csv("2012-2013UTASV131129.csv")
Rows: 1900 Columns: 320
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (15): PREFNAME, CITY, Q0102FA, Q0104FA, Q0106FA, Q0120FA, Q0125FA, Q013...
dbl (303): ID, PREFEC, HRDIST, Q010100, Q010200, Q010300, Q010400, Q010500, ...
lgl   (2): Q0119FA, Q0137FA

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$Q014100)
  1   2 
942 958 

2009年衆院選, 2010年参院選(2波パネル)

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2009_2010utas130816.sav",
              "2009_2010utas130816.sav")

## データの読み込み
library(haven)
dt <- read_sav("2009_2010utas130816.sav")
## 性別変数(1=男性, 2=女性, 9=無回答)
table(dt$Q014600)
Warning: Unknown or uninitialised column: `Q014600`.

< table of extent 0 >

2007年4-5月, 選挙前, 選挙後(3波パネル)

  • 調査ページ

  • コードブック:『日本政治研究』第5巻1・2合併号(ゼミ生の場合はこのリンクから限定アクセス)

  • Rを使ったデータ入手方法(元ファイルが直接Rで読めないので、限定アクセスのGoogle Driveに保存している修正済ファイルを使います):

## データのダウンロード
## 初回には、GoogleアカウントとTidyverse Packageの接続許可を求められます。
library(httpuv) 
library(googledrive)
with_drive_quiet(drive_download(as_id("1iDm1-Jy8TCTARugm2rjdeJpF-Fjm3pVx"),overwrite = TRUE))

## データの読み込み
library(readxl)
dt <- read_xlsx("utas080112.xlsx")
## 性別変数(1=男性, 2=女性)
table(dt$Q016600)
   1    2 
 944 1125 

2003年9月, 2003年衆院選, 2004年参院選, 2005年衆院選(4波パネル)

  • 調査ページ

  • コードブック:『日本政治研究』第2巻1号(1)(2)(3)・第3巻1号(4)(ゼミ生の場合はこのリンクから簡易版が限定アクセス)

  • Rを使ったデータ入手方法:

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/utas060104xls.zip", "utas060104xls.zip")
unzip("utas060104xls.zip")
file.remove("utas060104xls.zip")

## データの読み込み
library(readxl)
dt <- read_xls("utas060104.xls")
## 性別変数(1=男性, 0=女性)
table(dt$f010100)
   0    1 
1023  955 

政治家調査

2024年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2024UTASP20241125.csv",
              "2024UTASP20241125.csv")

## データの読み込み
library(readr)
dt <- read_csv("2024UTASP20241125.csv")
Rows: 1344 Columns: 122
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (6): NAME, KANA, Q1_1_FA, Q1_2_FA, Q1_3_FA, SQ9_17_FA
dbl (116): ID, RESPONSE, PREFEC, DISTRICT, PR, PRBLOCK, PARTY, INCUMB, TERM,...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
   1    2 
1030  314 

2022年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2022UTASP20220720.csv",
              "2022UTASP20220720.csv")

## データの読み込み
library(readr)
dt <- read_csv("2022UTASP20220720.csv")
Rows: 668 Columns: 111
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (6): NAME, Q10, Q1_1_FA, Q1_2_FA, Q1_3_FA, SQ6_16_FA
dbl (105): ID, RESPONSE, NOELEC, DISTRICT, PARTY, INCUMB, TERM, SEX, AGE, RE...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$SEX)
  1   2 
458 210 

2021年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2021UTASP20211126_excludedQ11.csv",
              "2021UTASP20211126_excludedQ11.csv")

## データの読み込み
library(readr)
dt <- read_csv("2021UTASP20211126_excludedQ11.csv")
Rows: 1051 Columns: 120
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (6): NAME, KANA, Q1_1_FA, Q1_2_FA, Q1_3_FA, SQ8_16_FA
dbl (114): ID, RESPONSE, PREFEC, DISTRICT, PR, PRBLOCK, PARTY, INCUMB, TERM,...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
  1   2 
865 186 

2019年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2019UTASP20191109.csv",
              "2019UTASP20191109.csv")

## データの読み込み
library(readr)
dt <- read_csv("2019UTASP20191109.csv")
Rows: 491 Columns: 126
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (5): NAME, Q1_1_FA, Q1_2_FA, Q1_3_FA, SQ7_16_FA
dbl (121): ID, RESPONSE, NOELEC, DISTRICT, PARTY, INCUMB, TERM, SEX, AGE, RE...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
  1   2 
359 132 

2017年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2017UTASP20180628.csv",
              "2017UTASP20180628.csv")

## データの読み込み
library(readr)
dt <- read_csv("2017UTASP20180628.csv")
Rows: 1180 Columns: 77
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (7): NAME, Q1_1_FA, Q1_2_FA, Q1_3_FA, SQ7_1_1_FA, SQ7_1_2_FA, SQ7_1_3_FA
dbl (70): ID, RESPONSE, PREFEC, DISTRICT, PR, PRBLOCK, PARTY, MINSHIN, INCUM...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
  1   2 
971 209 

2016年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2016UTASP20161010.csv",
              "2016UTASP20161010.csv")

## データの読み込み
library(readr)
dt <- read_csv("2016UTASP20161010.csv")
Rows: 510 Columns: 94
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (6): NAME, Q14, Q1_1_FA, Q1_2_FA, Q1_3_FA, Q6_15_FA
dbl (88): ID, RESPONSE, NOELEC, DISTRICT, PARTY, INCUMB, TERM, SEX, AGE, RES...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
  1   2 
392 118 

2014年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2014UTASP20150910.csv",
              "2014UTASP20150910.csv")

## データの読み込み
library(readr)
dt <- read_csv("2014UTASP20150910.csv")
Rows: 1191 Columns: 82
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (8): NAME, Q1_1FA, Q1_2FA, Q1_3FA, SQ8_1FA, SQ8_2FA, SQ8_3FA, Q15FA
dbl (74): ID, RESPONSE, PREFEC, DISTRICT, PR, PRBLOCK, INCUMB, TERM, PARTY, ...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性、99=無回答)
table(dt$SEX)
  1   2 
993 198 

2013年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2013UTASP130722.csv",
              "2013UTASP130722.csv")

## データの読み込み
library(readr)
dt <- read_csv("2013UTASP130722.csv")
Rows: 554 Columns: 95
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (2): NAME, Q16
dbl (93): ID, RESPONSE, NOELEC, DISTRICT, INCUMB, PARTY, PROP, TERM, SEX, RE...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
  1   2 
432 122 

2012年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2012UTASP20150910.csv",
              "2012UTASP20150910.csv")

## データの読み込み
library(readr)
dt <- read_csv("2012UTASP20150910.csv")
Rows: 1504 Columns: 128
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr   (2): NAME, Q15
dbl (124): RESPONSE, PREFEC, DISTRICT, PR, PRBLOCK, INCUMB, TERM, PARTY, SEX...
num   (2): ID, Q14

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性)
table(dt$SEX)
   1    2 
1280  224 

2010年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2010ates101105.sav",
              "2010ates101105.sav")

## データの読み込み
library(haven)
dt <- read_sav("2010ates101105.sav")
## 性別変数(1=男性, 2=女性, 9=無回答)
table(dt$SEX)
  1   2 
353 104 

2009年衆院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2009UTASP20150910.csv",
              "2009UTASP20150910.csv")

## データの読み込み
library(readr)
dt <- read_csv("2009UTASP20150910.csv")
Rows: 1374 Columns: 97
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (1): NAME
dbl (96): ID, oldID, RESPONSE, PREFEC, DISTRICT, PRBLOCK, INCUMB, TERM, PART...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 2=女性, 9=無回答)
table(dt$SEX)
   1    2 
1145  229 

2007年参院選

  • 調査ページ

  • コードブック:『日本政治研究』第5巻1・2合併号(ゼミ生の場合はこのリンクから簡易版に限定アクセス)

  • Rを使ったデータ入手方法:

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2007ates071221.sav",
              "2007ates071221.sav")

## データの読み込み
library(haven)
dt <- read_sav("2007ates071221.sav")
## 候補者名変数(最初の数名)※性別変数なし
head(dt$name)
[1] "伊達忠一" "小川勝也" "畠山和也" "浅野隆雄" "千代信人" "羽柴秀吉"

2005年衆院選

  • 調査ページ

  • コードブック:『日本政治研究』第5巻1・2合併号

  • Rを使ったデータ入手方法:

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2005ates0801171.csv",
              "2005ates0801171.csv")

## データの読み込み
library(readr)
dt <- read_csv("2005ates0801171.csv", locale = locale(encoding = "CP932"))
Rows: 1131 Columns: 50
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr  (7): familyna, firstnam, 小泉評価理由, 小泉支持理由, 望ましい首相, 消費税率, 改正分野...
dbl (43): pid, response, sex, age, assassim, blockcod, prefectu, prefdist, p...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 0=女性)
table(dt$sex)
  1   2 
984 147 

2004年参院選

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/2004UTASP20220409.csv",
              "2004UTASP20220409.csv")

## データの読み込み
library(readr)
dt <- read_csv("2004UTASP20220409.csv")
Rows: 482 Columns: 54
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (12): name, policy2, support2, admitype2, pm, nenkin2, nenkinout2, futur...
dbl (42): id, mode, won, electcod, party, age, sex, incumben, response, poli...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 性別変数(1=男性, 0=女性)
table(dt$sex)
  1   2 
390  92 

2003年衆院選

  • 調査ページ

  • コードブック:『日本政治研究』第2巻2号

  • Rを使ったデータ入手方法:

## データのダウンロード
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/ates1v1.csv", 
              "ates1v1.csv") # 衆議院議員調査
download.file("https://www.masaki.j.u-tokyo.ac.jp/utas/ates2v1.csv", 
              "ates2v1.csv") # 衆院選候補者調査

## データの読み込み
library(readr)
dt1 <- read_csv("ates1v1.csv", locale=locale(encoding="CP932"))
dt2 <- read_csv("ates2v1.csv", locale=locale(encoding="CP932"))
Rows: 480 Columns: 29
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (22): name, defense, nuclear, treaty, attack, un, smallgov, woman, lifet...
dbl  (7): id, wave2id, response, blockcod, prefectu, prefdist, partycod

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Rows: 1159 Columns: 42
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (31): name, coalitio, pastkoiz, futureko, elecsys1, elecsys2, appeal, ma...
dbl (11): id, wave1id, response, blockcod, prefectu, prefdist, partycod, inc...

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## 候補者名変数 ※性別変数はなし
head(dt1$name)
[1] "横路孝弘"   "吉川貴盛"   "荒井聡"     "佐藤静雄"   "町村信孝"  
[6] "佐々木秀典"
head(dt2$name)
[1] "三品孝行" "横路孝弘" "横山博子" "広坂光則" "石田幸子" "三井辨雄"

外交に関する世論調査/外国のイメージと時事問題に関する調査 (2011-13)

河野勝(早稲田大学)を中心とした研究グループによって、2011年10月から2013年9月まで毎月、合計24回行われたオンライン調査(調査会社:日経リサーチ)です。特に、外交や国際関係に関する政治争点に注目し、質問を構成しています。各12ヶ月続いた2つのパネル・サーベイと、毎月新規にサンプルをとって行われたフレッシュ・サンプルサーベイの2つに分かれています。加えてオンラインサーベイとは別に、2012年11月に実施された郵送調査もあります。以下では、Harvard Dataverseにアップロードされているデータの入手・利用方法を説明します。

Wave 1-12(2011年10月〜2012年9月)パネル+フレッシュサンプル

## データのダウンロード
# library(remotes)
# remotes::install_github("iqss/dataverse-client-r")
library(dataverse)
dt <- get_dataframe_by_name(
  filename = "sifcct_hdv_wave1-12.tab",
  dataset = "10.7910/DVN/LTJEO9", 
  server = "dataverse.harvard.edu", 
  original = TRUE, .f = readr::read_csv)
saveRDS(dt, "sifcct_hdv_wave1-12.rds")

## データの読み込み
dt <- readRDS("sifcct_hdv_wave1-12.rds")
## 性別変数(1=男性, 2=女性, 3=答えたくない)
table(dt$i38)
    1     2     3 
20610 18675    22 

Wave 13-24(2012年10月〜2013年9月)パネル+フレッシュサンプル

## データのダウンロード
# library(remotes)
# remotes::install_github("iqss/dataverse-client-r")
library(dataverse)
dt <- get_dataframe_by_name(
  filename = "sifcct_hdv_wave13-24.tab",
  dataset = "10.7910/DVN/LTJEO9", 
  server = "dataverse.harvard.edu", 
  original = TRUE, .f = readr::read_csv)
saveRDS(dt, "sifcct_hdv_wave13-24.rds")

## データの読み込み
dt <- readRDS("sifcct_hdv_wave13-24.rds")
## 性別変数(1=男性, 2=女性, 3=答えたくない)
table(dt$i38)
    1     2     3 
19428 18145   198 

郵送調査(2012年11月)

## データのダウンロード
# library(remotes)
# remotes::install_github("iqss/dataverse-client-r")
library(dataverse)
dt <- get_dataframe_by_name(
  filename = "sifcct_hdv_mail.tab",
  dataset = "10.7910/DVN/LTJEO9", 
  server = "dataverse.harvard.edu", 
  original = TRUE, .f = readr::read_csv)
saveRDS(dt, "sifcct_hdv_mail.rds")

## データの読み込み
dt <- readRDS("sifcct_hdv_mail.rds")
## 性別変数(1=男性, 2=女性, 3=答えたくない)
table(dt$i38)
  1   2   3 
829 798  34 

日本版 General Social Surveys (JGSS, 2000-2018)

アメリカにおけるGeneral Social Surveys (GSS)とパラレルな調査として、日本で継続して実施されてきている社会学系世論調査です。 多くの政治に関連する質問を含んでいます。様々なチャンネルを通じて、データが公開されていますが、明治大学生であれば、ICPSRのウェブサイトでMeijiMailでアカウントを作り、ダウンロードするのが一番効率的だと思います。

質問票の確認

JGSS研究センターの調査概要ページに行くと、これまで行われた、すべてのJGSS調査の質問票が確認できます。データをダウンロードする前にここで自分の関心がある質問が(どの年に)聞かれているかどうかを確認しましょう。

ただし、最新のJGSS調査は、一般公開やICPSRからの提供が行われていません。今、ICPSRで利用可能なデータは以下のものだけであることには注意してください。

  • JGSS-2017G/2018G統合データ
  • JGSS-2017/2018統合データ
  • JGSS-2015
  • JGSS-2012
  • JGSS-2010
  • JGSS-2008
  • JGSS-2006
  • JGSS-2005
  • JGSS累積データ 2000-2003
  • JGSS-2003
  • JGSS-2002
  • JGSS-2001
  • JGSS-2000

ダウンロード方法(ICPSRの他のデータも同様)

  1. まずは、このページに行って、MeijiMailのアドレスでアカウントを作る。

  2. 作ったアカウントを使って、ICPSRのウェブサイトにEmailでログインする。

  3. JGSSのデータリストのページから、好きな年のデータを選んでクリックする。

  4. データ説明ページにある「Download」ボタンをクリックし、SPSS形式を選択してクリックする(他の形式でも構いませんが、以下ではSPSS形式を前提として説明します)。

  5. Term of Useが出てくるので、目を通した上で「Agree」をクリックする。

  6. すると、Zipファイルでのダウンロード画面がポップアップするので、「Save as… 名前をつけて保存」をクリックし、R分析用のワーキングディレクトリにダウンロードする。

  7. 同じワーキングディレクトリにRスクリプトを作って仮保存し、以下を実行する(以下では、JGSS2017-2018をダウンロードしたとします)。

## ダウンロードしたZIPファイルの名前
zipname <- "ICPSR_38163-V1.zip"

## zipファイルを解凍して元ファイルを消す
unzip(zipname, overwrite = TRUE)
invisible(file.remove(zipname))
### DS0001サブフォルダの中に英語のデータおよび質問票など、
### DS0002サブフォルダの中に、日本語の質問票やコードブックが入っている

### データ名+パスの確認
datadir <- paste0(gsub("\\-.*$","",zipname),"/DS0001/")
dataname <- list.files(datadir)[grep("sav$",list.files(datadir))]
print(paste0(datadir,dataname))

## データの読み込み(上で取得した名前を使う)
library(haven)
dt <- read_sav("ICPSR_38163/DS0001/38163-0001-Data.sav")

## 性別変数(1=男性, 2=女性)
table(dt$SEXA)
   1    2 
1255 1405 

その他の世論調査

以下に、その他無料で入手可能な世論調査へのリンクを紹介します。国際比較調査が多いですが、日本が含まれているものも多くあります。まずは、リンク先のウェブサイトでCodebook/Questionnaireをチェックし、自分の関心のある質問・時期・対象国がカバーされているかチェックしてください。データの入手方法について、需要が高まれば随時アップデートします。

世論調査の検索

  • Social Science Japan Archive(SSJDA). 日本における多種多様な世論調査データが寄託されているデータ・アーカイヴです。非常に幅広いデータがあり、どれも無料で入手できますが、学部生の使用が制限されていたり、使用申請をしてから使用できるまでに時間がかかったりします。検索をしてみて、どう しても関心があるデータがある場合は、私まで教えてください。

  • Inter-university Consortium for Political and Social Research(ICPSR). JGSSの入手方法ですでに紹介しましたが、こちらも多種多様なデータが寄託されているデータアーカイヴで、アメリカ発のサイトですが、日本のデータも多くあります。説明したとおり、明治大学は会員ですので、MeijiMailでアカウントを作れば、無料でデータをダウンロードできます。

  • GESIS. 社会科学系のデータを集積している、ドイツ発のウェブサイトです。ここも大量のデータを検索できるので、興味のあるトピックを入力して探してみるといいでしょう。特にヨーロッパのデータが充実しています。

大規模国際比較世論調査(含日本)

  • 世界価値観調査 (World Values Survey: WVS). 社会・政治的な価値観に関する多くの設問を含む、古典的な国際比較世論調査で、日本も昔から参加しています。国レベルのデータは、ウェブサイトの “Data & Documentation” -> “Data Download” -> “Wave X”. から、Excel,SPSS,STATA形式のデータがダウンロードできます。ただし、最新データはデータを開く際にエラーが出るという話もあるので、もしトラブルがあった場合は連絡してください。
  • International Social Survey Programme (ISSP). 国際的に共通の質問を含めて行われている社会学系世論調査で、日本もJGSSで参加しています。各年によって特定のテーマの質問を含めて行われることが特徴です “Data Download”項目から、STATAとSPSS形式でデータが入手できます。
  • Comparative Study of Electoral Systems (CSES). 様々な国での選挙時世論調査の結果を含めた国際共同プロジェクトです。日本も参加しています。“Download Data”項目から、SPSS, Stata, CSV形式でデータがダウンロードできます。
  • Global Barometer Surveys(GBS). 下の項目で触れている、LatinoBarometro、Afrobarometer, Asian Barometer, Arab Barometer, Eurasia Barometerの各研究グループが協力して、これらのサーベイ間で共通した、もしくは近い内容の設問を集めて一つのデータにしたサーベイです。他の調査ではあまり対象になっていないような国が多く入っているのが特徴です。

地域レベルでの国際比較が可能な世論調査

Social Surveys

Barometer Surveys

アメリカ

イギリス

選挙データ(選挙区レベル)

衆議院議員選挙データ(1947-2018)

The Reed-Smith Japanese House of Representatives Elections Datasetは、1947年〜2018年までのすべての衆議院議員選挙における候補者と選挙結果をまとめたデータです。東大朝日調査の候補者レベルデータと合わせて使うこともできるはずです。Harvard Dataverseから入手できます。

## データのダウンロード
# library(remotes)
# remotes::install_github("iqss/dataverse-client-r")
library(dataverse)
dt <- get_dataframe_by_name(
  filename = "Reed-Smith-JHRED-CANDIDATES.dta",
  dataset = "10.7910/DVN/QFEPXD", 
  server = "dataverse.harvard.edu", 
  original = TRUE, .f = haven::read_dta)
saveRDS(dt, "Reed-Smith-JHRED-CANDIDATES.rds")

## データの読み込み
dt <- readRDS("Reed-Smith-JHRED-CANDIDATES.rds")
## 候補者名変数(性別変数はなし)
head(dt$name_jp)
[1] "がくし勇三郎"       "ガッツ石松"         "さとうふみや"      
[4] "ツルネン・マルテイ" "トクマ"             "ト部政巳"          

衆議院議員選挙データ(2021, 2024)

Reed-Smithデータに含まれていない2021年と2024年の衆議院議員選挙データに関しては、高知工科大学の矢内勇生先生のウェブサイトに公開されているものが便利です。

2024年衆院選データ

## 小選挙区データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2024_districts.csv", "hr2024_districts.csv")

## 小選挙区データの読み込み
library(readr)
dt <- read_csv("hr2024_districts.csv")

## 候補者名変数(性別変数はなし)
head(dt$name)
Rows: 1113 Columns: 19
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (11): prefecture, district, name, yomi, lastname, firstname, last_kana, ...
dbl  (8): dist_no, age, previous, duplicate, win_smd, win_pr, votes, vshare

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "小林 悟"   "道下 大樹" "田中 義人" "千葉 尚子" "加藤 貴弘" "山崎 泉"  
## 比例区(候補者別)データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2024_pr_candidates.csv", "hr2024_pr_candidates.csv")

## 比例区(候補者別)データの読み込み
library(readr)
dt <- read_csv("hr2024_pr_candidates.csv")

## 候補者名変数(性別変数はなし)
head(dt$name)
Rows: 881 Columns: 18
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (11): block, party, name, yomi, lastname, firstname, last_kana, first_ka...
dbl  (7): rank, age, previous, dup, win_smd, win_pr, loss_ratio

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "小林 悟"   "山崎 泉"   "鳥越 良孝" "喜多 義典" "伊東 良孝" "加藤 貴弘"
## 比例区(政党別)データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2024_pr_parties.csv", "hr2024_pr_parties.csv")

## 比例区(政党別)データの読み込み
library(readr)
dt <- read_csv("hr2024_pr_parties.csv")

## 政党名変数
head(dt$party)
Rows: 107 Columns: 7
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (2): block, party
dbl (5): n_cand, pr_wins, smd_wins, votes, vshare

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "れいわ新選組" "公明党"       "参政党"       "国民民主党"   "日本共産党"  
[6] "日本維新の会"

2021年衆院選データ

## 小選挙区データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2021_districts.csv", "hr2021_districts.csv")

## 小選挙区データの読み込み
library(readr)
dt <- read_csv("hr2021_districts.csv")

## 候補者名変数(性別変数はなし)
head(dt$name)
Rows: 857 Columns: 19
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (11): prefecture, district, name, yomi, lastname, firstname, last_kana, ...
dbl  (8): dist_no, age, previous, duplicate, win_smd, win_pr, votes, vshare

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "小林 悟"   "道下 大樹" "船橋 利実" "高橋 祐介" "松木 謙公" "山崎 泉"  
## 比例区(候補者別)データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2021_pr_candidates.csv", "hr2021_pr_candidates.csv")

## 比例区(候補者別)データの読み込み
library(readr)
dt <- read_csv("hr2021_pr_candidates.csv")

## 候補者名変数(性別変数はなし)
head(dt$name)
Rows: 818 Columns: 17
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (11): block, party, name, yomi, lastname, firstname, last_kana, first_ka...
dbl  (6): rank, age, previous, win_smd, win_pr, loss_ratio

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "豊巻 絹子" "佐藤 英道" "荒瀬 正昭" "道下 大樹" "松木 謙公" "荒井 優"  
## 比例区(政党別)データのダウンロード
download.file("https://yukiyanai.github.io/jp/resources/data/hr2021_pr_parties.csv", "hr2021_pr_parties.csv")

## 比例区(政党別)データの読み込み
library(readr)
dt <- read_csv("hr2021_pr_parties.csv")

## 政党名変数
head(dt$party)
Rows: 103 Columns: 7
── Column specification ────────────────────────────────────────────────────────
Delimiter: ","
chr (2): block, party
dbl (5): n_cand, pr_wins, smd_wins, votes, vshare

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

[1] "NHKと裁判してる党弁護士法72条違反で"
[2] "れいわ新選組"                            
[3] "公明党"                                  
[4] "国民民主党"                              
[5] "日本共産党"                              
[6] "日本維新の会"                            

参議院議員選挙データ

参議院議員選挙については、あまり詳しく説明しませんが、以下のサイトが利用できるでしょう。

その他海外の政治家・選挙関連データ

(必要に応じて入手方法をアップデートします)

比較政治(国・地域レベル)データ

Quality of Government (QoG)

QoGは、国レベルで計測されるあらゆる政治に関わる変数を集めた国際比較データです。2025年1月時点での現状を比較するCross-Sectionデータと、年次ごとのパネルデータであるTime-Series Dataの2種類があります。厳密な分析にはTime-Seriesデータが必須ですが、簡易的にパターンを見たい場合は、Cross-Sectionデータを利用すると良いでしょう。

## Cross-Section データのダウンロード
download.file("https://www.qogdata.pol.gu.se/data/qog_std_cs_jan25.sav","qog_std_cs_jan25.sav")

## データの読み込み
library(haven)
dt <- read_sav("qog_std_cs_jan25.sav")

## 国名変数
head(dt$cname)
[1] "Afghanistan"         "Albania"             "Algeria"            
[4] "Andorra"             "Angola"              "Antigua and Barbuda"
  • Time-Seriesデータの入手と利用
## Time-Series データのダウンロード
download.file("https://www.qogdata.pol.gu.se/data/qog_std_ts_jan25.sav","qog_std_ts_jan25.sav")

## データの読み込み
library(haven)
dt <- read_sav("qog_std_ts_jan25.sav")

## 国名変数
head(dt$cname) # パネルなので同じ国名が並ぶ
[1] "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan"
[6] "Afghanistan"

その他の集計レベルデータ

(必要に応じて入手方法をアップデートします)