在百度百科任美锷 词条下有一份中国科学院已故院士名单,有人名和逝世日期。下面逐年统计人数
# 数据来源 https://baike.baidu.com/item/%E4%BB%BB%E7%BE%8E%E9%94%B7/3559842
# 复制粘贴保存到 txt 文件中
chinese_academic <- readLines(con = file("中国科学院院士死亡名单.txt"))
chinese_academic_mat <- matrix(data = chinese_academic, ncol = 2, byrow = TRUE)
colnames(chinese_academic_mat) <- c("姓名", "逝世日期")
chinese_academic_df <- as.data.frame(chinese_academic_mat)
chinese_academic_df$逝世日期 <- sub(x = chinese_academic_df$逝世日期, pattern = "逝世日期:", replacement = "")
chinese_academic_df$逝世日期 <- gsub(x = chinese_academic_df$逝世日期, pattern = "\\.", replacement = "-")
chinese_academic_df$逝世日期 <- as.Date(chinese_academic_df$逝世日期)
chinese_academic_df$逝世年份 <- format(chinese_academic_df$逝世日期, "%Y")
aggregate(data = chinese_academic_df, 姓名 ~ 逝世年份, length)
逝世年份 姓名
1 1957 2
2 1958 2
3 1959 1
4 1960 1
5 1961 1
6 1962 4
7 1963 2
8 1964 3
9 1965 3
10 1966 3
11 1967 2
12 1968 5
13 1969 3
14 1970 2
15 1971 4
16 1972 6
17 1973 2
18 1974 3
19 1975 5
20 1976 5
21 1977 5
22 1978 1
23 1979 5
24 1980 3
25 1981 6
26 1982 6
27 1983 10
28 1984 5
29 1985 9
30 1986 7
31 1987 10
32 1988 8
33 1989 15
34 1990 8
35 1991 11
36 1992 17
37 1993 11
38 1994 13
39 1995 14
40 1996 15
41 1997 15
42 1998 17
43 1999 10
44 2000 15
45 2001 20
46 2002 14
47 2003 12
48 2004 13
49 2005 17
50 2006 14
51 2007 12
52 2008 17
53 2009 13
54 2010 20
55 2011 18
56 2012 17
57 2013 13
58 2014 20
59 2015 14
60 2016 24
61 2017 16
62 2018 16
63 2019 19
64 2020 19
65 2021 17
66 2022 26
67 2023 23
已故院士一共 689 人。