Nhận dạng những công trình nghiên cứu có ảnh hưởng lớn
Trong khoa học, có những công trình dù không được giải thưởng gì quan trọng, nhưng lại gây ảnh hưởng rất lớn. “Ảnh hưởng” ở đây hiểu theo nghĩa được nhiều đồng nghiệp trích dẫn. Do đó, một thước đo quan trọng để đánh giá tầm ảnh hưởng của công trình khoa học là qua chỉ số trích dẫn. Trong một phân tích mà tôi điểm qua dưới đây cho thấy trong số hàng triệu công trình nghiên cứu, chỉ có khoảng 0.017% được xem là có ảnh hưởng lớn. Phần lớn những công trình này xuất phát từ Mĩ.
Trong thế giới khoa học, số lượng không quan trọng bằng chất lượng. Công bố nhiều công trình nghiên cứu là một phản ảnh về mức độ hoạt động (research activity). Mức độ hoạt động có thể chịu ảnh hưởng bởi các yếu tố mang tính cấu trúc, như đầu tư, cơ sở vật chất, v.v. Nhưng một khía cạnh khác còn quan trọng hơn mức độ hoạt động là chất lượng nghiên cứu. Một đại học có thể có ít nghiên cứu, nhưng nếu đó là những nghiên cứu có tầm ảnh hưởng lớn, thì sẽ được đánh giá cao. Chẳng hạn như trước đây tôi đã chỉ ra rằng Đại học Quốc gia TPHCM (VNU-HCM) tuy số công bố quốc tế rất thấp so với các đại học trong vùng như Chulalongkorn, Mahidol, hay Malaya, nhưng tầm ảnh hưởng của nghiên cứu của VNU-HCM thì hơn hẳn các đại học trong vùng.
Tầm ảnh hưởng là khái niệm tương đối mới. Có lẽ Eugene Garfield (người sáng lập ISI) là người đầu tiên khởi xướng phương pháp đánh giá khoa học. Theo Garfield, có thể lấy chỉ số trích dẫn làm một thước đo tầm ảnh hưởng của một công trình nghiên cứu. Theo cách đánh giá này, công trình nghiên cứu nào được nhiều trích dẫn là công trình có ảnh hưởng cao.
Nhưng vấn đề đặt ra là lấy ngưỡng nào để đánh giá là “có ảnh hưởng”. Trong một bài báo mới đây, tôi ghi nhận được vài thống kê thú vị: chỉ có 45% những bài báo công bố trên những tập san hàng đầu được trích dẫn trong 5 năm sau đó. Con số mới đây của Péter Jacsó (Online Information Review) cho biết khoảng 41% bài báo công bố trên các tập san hàng đầu được trích dẫn trong thời gian 2002-2006. Nói cách khác, rất nhiều (có thể đến 60%) bài báo không được trích dẫn, có lẽ chẳng gây tác động gì, mà chỉ … tốn giấy mực. Ngay cả được trích dẫn và tham khảo, con số cũng rất khiêm tốn : chỉ có trên dưới 1% bài báo khoa học được trích dẫn hơn 6 lần mà thôi (trong vòng 5 năm). Do đó, có người đề nghị là một bài báo được trích dẫn một cách độc lập (tức không phải chính tác giả tự trích dẫn) hơn 5 lần được xem là "có ảnh hưởng". Những công trình có ảnh hưởng lớn thường có số lần trích dẫn 100 lần trở lên.
Nhưng để đạt đẳng cấp high-cited thì con số 100 chưa đủ. Theo một qui ước chung, những bài có trên 1000 trích dẫn được xem là những công trình top-cited. Nhưng những bài báo đó thuộc nhóm nào, xuất phát từ đâu? Trong một bài báo gần đây trênScientometrics, tác giả Yuh Shan Ho cung cấp cho chúng ta nhiều dữ liệu rất thú vị. Tác giả điểm qua tất cả những bài báo trên 8073 tập san khoa học trong thư mục SCI-E (Science Citation Index - Expanded) từ 1991 đến 2010 (tức 20 năm). Sau đây là tóm lược những dữ liệu chính:
Số bài có ảnh hưởng lớn. Trong số 21,066,849 bài báo công bố trong thời gian 20 năm, có 3652 bài có trích dẫn trên 1000 lần. Nói cách khác, tỉ lệ số bài báo có ảnh hưởng lớn chỉ 0.017%. Nói cách khác, cứ 100,000 bài công bố, chỉ có 17 bài là có trích dẫn trên 1000 lần.
Thể loại. Trong số 3652 bài có ảnh hưởng lớn, 70% là những bài báo nguyên thuỷ (original article), và 26% là những bài tổng quan (review).
Tập san. Không ngạc nhiên khi thấy những tập san lớn như Science, Nature, New England Journal of Medicine, Lancet, PNAS, v.v. là những tập san có nhiều bài có ảnh hưởng lớn. Bảng dưới đây trình bày những tập san có nhiều bài có ảnh hưởng lớn:
Hai mươi tập san hàng đầu có nhiều công trình có ảnh hưởng lớn
Quốc gia. Khoảng 70% những công trình có ảnh hưởng lớn là xuất phát từ Mĩ. Những quốc gia có nhiều công trình top-cited là (theo thứ tự): Anh (458 bài), Đức (282), Pháp (227), và Canada (212). Việt Nam không có trong danh sách, nhưng Hàn Quốc, Đài Loan, và Singapore thì có.
Danh sách 29 nước có công trình top-cited
Trường / viện. Phần lớn các đại học và viện có công trình ảnh hưởng lớn là xuất phát từ Mĩ. Đại học Harvard đứng đầu danh sách các viện/trường có nhiều công trình top-cited. Các đại học kế tiếp là Stanford, Teas, MIT.
Danh sách 20 trường đại học có công trình top-cited
Trong thế giới khoa học, có những người tiếng Anh gọi là quiet achievers – thành công thầm lặng. Họ là những người ít ai biết đến, không có những giải thưởng lớn, nhưng công trình của họ lại gây ảnh hưởng trong khoa học rất lớn.
Trong các nhà khoa học Việt cũng có những người có những công trình có ảnh hưởng lớn. Người Việt trong ngành toán có ảnh hưởng lớn nhất nhưng âm thầm nhất có lẽ là Giáo sư Huỳnh Huynh (ĐH South Carolina). Một công trình công bố năm 1970 trên JASA (tập san khoa học thống kê số 1 trên thế giới) được trích dẫn gần 800 lần, là một trong những công trình trở thành tài liệu tham khảo cho bất cứ bài báo nào viết về repeated ANOVA, bất cứ chương trình máy tính dùng cho phân tích thống kê. Một công trình toán học khác của ông (nhưng đăng trên tập san về giáo dục) được trích dẫn trên 1000 lần cũng thuộc vào nhóm “top cited”. Có lẽ ông là nhà toán học gốc Việt Nam duy nhất có công trình nghiên cứu với trên 1000 trích dẫn.
Tóm lại, trong số hàng triệu công trình nghiên cứu, chỉ có khoảng 17 trên 100,000 công trình là thuộc vào nhóm top-cited (tức có ảnh hưởng lớn). Những công trình có ảnh hưởng lớn thường xuất phát từ Mĩ, và công bố trên những tập san lớn nhưScience, Nature, và New England Journal of Medicine. Có ít nhất một người Việt cũng có đóng góp vào những công trình top-cited nhưng là người Việt ở Mĩ. Những công trình này không hẳn là “đột phá” trong khoa học, nhưng không có những công trình này thì các khoa học khác khó có đột phá thật sự.
Tham khảo:
Ho YS. The top-cited research works in the Science Citation Index Expanded. Scientometrics 2013;94:1297-1312
Mark Bauerlein, et al. We Must Stop the Avalanche of Low-Quality Research . The Chronicle of Higher Ed 13/6/2010.
Trong thế giới khoa học, số lượng không quan trọng bằng chất lượng. Công bố nhiều công trình nghiên cứu là một phản ảnh về mức độ hoạt động (research activity). Mức độ hoạt động có thể chịu ảnh hưởng bởi các yếu tố mang tính cấu trúc, như đầu tư, cơ sở vật chất, v.v. Nhưng một khía cạnh khác còn quan trọng hơn mức độ hoạt động là chất lượng nghiên cứu. Một đại học có thể có ít nghiên cứu, nhưng nếu đó là những nghiên cứu có tầm ảnh hưởng lớn, thì sẽ được đánh giá cao. Chẳng hạn như trước đây tôi đã chỉ ra rằng Đại học Quốc gia TPHCM (VNU-HCM) tuy số công bố quốc tế rất thấp so với các đại học trong vùng như Chulalongkorn, Mahidol, hay Malaya, nhưng tầm ảnh hưởng của nghiên cứu của VNU-HCM thì hơn hẳn các đại học trong vùng.
Tầm ảnh hưởng là khái niệm tương đối mới. Có lẽ Eugene Garfield (người sáng lập ISI) là người đầu tiên khởi xướng phương pháp đánh giá khoa học. Theo Garfield, có thể lấy chỉ số trích dẫn làm một thước đo tầm ảnh hưởng của một công trình nghiên cứu. Theo cách đánh giá này, công trình nghiên cứu nào được nhiều trích dẫn là công trình có ảnh hưởng cao.
Nhưng vấn đề đặt ra là lấy ngưỡng nào để đánh giá là “có ảnh hưởng”. Trong một bài báo mới đây, tôi ghi nhận được vài thống kê thú vị: chỉ có 45% những bài báo công bố trên những tập san hàng đầu được trích dẫn trong 5 năm sau đó. Con số mới đây của Péter Jacsó (Online Information Review) cho biết khoảng 41% bài báo công bố trên các tập san hàng đầu được trích dẫn trong thời gian 2002-2006. Nói cách khác, rất nhiều (có thể đến 60%) bài báo không được trích dẫn, có lẽ chẳng gây tác động gì, mà chỉ … tốn giấy mực. Ngay cả được trích dẫn và tham khảo, con số cũng rất khiêm tốn : chỉ có trên dưới 1% bài báo khoa học được trích dẫn hơn 6 lần mà thôi (trong vòng 5 năm). Do đó, có người đề nghị là một bài báo được trích dẫn một cách độc lập (tức không phải chính tác giả tự trích dẫn) hơn 5 lần được xem là "có ảnh hưởng". Những công trình có ảnh hưởng lớn thường có số lần trích dẫn 100 lần trở lên.
Nhưng để đạt đẳng cấp high-cited thì con số 100 chưa đủ. Theo một qui ước chung, những bài có trên 1000 trích dẫn được xem là những công trình top-cited. Nhưng những bài báo đó thuộc nhóm nào, xuất phát từ đâu? Trong một bài báo gần đây trênScientometrics, tác giả Yuh Shan Ho cung cấp cho chúng ta nhiều dữ liệu rất thú vị. Tác giả điểm qua tất cả những bài báo trên 8073 tập san khoa học trong thư mục SCI-E (Science Citation Index - Expanded) từ 1991 đến 2010 (tức 20 năm). Sau đây là tóm lược những dữ liệu chính:
Số bài có ảnh hưởng lớn. Trong số 21,066,849 bài báo công bố trong thời gian 20 năm, có 3652 bài có trích dẫn trên 1000 lần. Nói cách khác, tỉ lệ số bài báo có ảnh hưởng lớn chỉ 0.017%. Nói cách khác, cứ 100,000 bài công bố, chỉ có 17 bài là có trích dẫn trên 1000 lần.
Thể loại. Trong số 3652 bài có ảnh hưởng lớn, 70% là những bài báo nguyên thuỷ (original article), và 26% là những bài tổng quan (review).
Tập san. Không ngạc nhiên khi thấy những tập san lớn như Science, Nature, New England Journal of Medicine, Lancet, PNAS, v.v. là những tập san có nhiều bài có ảnh hưởng lớn. Bảng dưới đây trình bày những tập san có nhiều bài có ảnh hưởng lớn:
Hai mươi tập san hàng đầu có nhiều công trình có ảnh hưởng lớn
Tập san |
Số bài với trích dẫn trên 1000 lần
|
Hệ số ảnh hưởng (impact factor) 2010
|
Science |
406
|
31.377
|
Nature |
378
|
36.104
|
New England Journal of Medicine |
203
|
53.486
|
Cell |
197
|
32.406
|
PNAS |
87
|
9.771
|
Lancet |
77
|
33.633
|
JAMA |
65
|
30.011
|
Physical Review Letters |
53
|
7.622
|
Journal of Chemical Physics |
27
|
2.921
|
Nucleic Acids Research |
26
|
7.836
|
Journal of Experimental Medicine |
24
|
14.776
|
Nature Genetics |
23
|
36.377
|
Nature Medicine |
20
|
25.430
|
Physical Review B |
20
|
3.774
|
Circulation |
18
|
14.432
|
Applied Physics Letters |
18
|
3.841
|
Cancer Journal for Clinicians |
17
|
94.333
|
Journal of the American Chemical Society |
17
|
9.023
|
Journal of Biological Chemistry |
17
|
5.328
|
Journal of Molecular Biology |
17
|
4.008
|
Quốc gia. Khoảng 70% những công trình có ảnh hưởng lớn là xuất phát từ Mĩ. Những quốc gia có nhiều công trình top-cited là (theo thứ tự): Anh (458 bài), Đức (282), Pháp (227), và Canada (212). Việt Nam không có trong danh sách, nhưng Hàn Quốc, Đài Loan, và Singapore thì có.
Danh sách 29 nước có công trình top-cited
Nước |
Số bài với trích dẫn trên 1000 lần
|
Phần trăm (tính trên tổng số 3652 bài)
|
Mĩ |
2160
|
71.0
|
Anh |
458
|
15.0
|
Đức |
282
|
9.3
|
Pháp |
227
|
7.5
|
Canada |
212
|
7.0
|
Nhật |
181
|
6.0
|
Hà Lan |
127
|
4.2
|
Thuỵ Sĩ |
124
|
4.1
|
Ý |
113
|
3.7
|
Úc |
96
|
3.2
|
Thuỵ Điển |
93
|
3.1
|
Bỉ |
69
|
2.3
|
Tây Ban Nha |
66
|
2.2
|
Do Thái |
58
|
1.9
|
Đan Mạch |
56
|
1.9
|
Áo |
44
|
1.5
|
Phần Lan |
39
|
1.3
|
Na Uy |
29
|
1.0
|
China |
27
|
0.89
|
Nga |
26
|
0.86
|
Ấn Độ |
18
|
0.60
|
Ba Lan |
15
|
0.50
|
Ba Tây |
14
|
0.46
|
Hungary |
11
|
0.36
|
Hàn Quốc |
10
|
0.33
|
Tân Tây Lan |
9
|
0.30
|
Singapore |
8
|
0.26
|
Đài Loan |
8
|
0.26
|
Tiệp |
8
|
0.26
|
Trường / viện. Phần lớn các đại học và viện có công trình ảnh hưởng lớn là xuất phát từ Mĩ. Đại học Harvard đứng đầu danh sách các viện/trường có nhiều công trình top-cited. Các đại học kế tiếp là Stanford, Teas, MIT.
Danh sách 20 trường đại học có công trình top-cited
Trường |
Số bài với trích dẫn trên 1000 lần
|
Phần trăm (tính trên tổng số 3652 bài)
|
Harvard |
231
|
7.6
|
Stanford |
120
|
4.0
|
Texas |
108
|
3.6
|
MIT |
106
|
3.5
|
Washington |
97
|
3.2
|
UCSD |
87
|
2.9
|
UC Berkeley |
85
|
2.8
|
Johns Hopkins |
81
|
2.7
|
UCSF |
79
|
2.6
|
Michigan |
72
|
2.4
|
Brigham Hospital |
69
|
2.3
|
Yale |
66
|
2.2
|
Mass Gen Hospital |
61
|
2.0
|
Washington Univ |
61
|
2.0
|
Oxford |
59
|
2.0
|
UCLA |
58
|
1.9
|
NCI |
57
|
1.9
|
Cambridge |
53
|
1.8
|
Columbia |
50
|
1.7
|
Pennsylvania |
50
|
1.7
|
Trong thế giới khoa học, có những người tiếng Anh gọi là quiet achievers – thành công thầm lặng. Họ là những người ít ai biết đến, không có những giải thưởng lớn, nhưng công trình của họ lại gây ảnh hưởng trong khoa học rất lớn.
Những công trình của họ không hẳn là “đột phá” trong khoa học, nhưng có thể chinh phục về phương pháp giúp cho các ngành khoa học khác phát triển. Chẳng hạn như công trình của Roger Tsien (ĐH Cambridge) tìm ra cách cho phép chúng ta quan sát calcium ion di chuyển trong tế bào; Nicoletta Sacchi (Mĩ) phát triển một phương pháp đơn giản chiết xuất RNA; Bert Vogelstein (ĐH Johns Hopkins) và đồng nghiệp tìm cách phát triển DNA probe mà giới nghiên cứu sinh học dùng ngày nay; Stephen Altschul (Viện ung thư Mĩ) làm ra chương trình máy tính để tìm DNA và proteins; v.v. Những công trình này không mang tính đột phá, nhưng đã giúp cho các nhà khoa học khác đột phát trong nghiên cứu của họ.
Nhưng trong lĩnh vực thống kê học, sau đây là 10 công trình gây ảnh hưởng cực kì lớn trong lịch sử khoa học, với số lần trích dẫn “khủng”: Chi tiết bài báo |
Số lần trích dẫn
|
Kaplan, E. L., Meier, P. (1958) Nonparametric estimation from incomplete observations. Journal of the American Statistical Association 53, pp. 457–481. |
38,655
|
Cox, D. R. (1972) Regression models and life tables. Journal of the Royal Statistical Society, Series B, 34, pp. 187–220. |
32,830
|
Bland, J. M., Altman, D. G. (1986) Statistical methods for assessing agreement between two clinical measurements. Lancet, 1 (8476) pp. 307–310. |
25,033
|
Felsenstein, J. (1985) Confidence limits on phylogenies: an approach using the bootstrap, Evolution 39, pp. 783–791. |
21,526
|
Marquardt, D. W. (1963) An algorithm for least squares estimation of non-linear parameters. Journal of the Society for Industrial and Applied Mathematics 2, pp. 431–441. |
17,764
|
Duncan, D. B. (1955) Multiple range and multiple F-tests. Biometrics 11, pp. 1–42. |
14,995
|
Mantel, N., Haenszel, W. (1959) Statistical aspects of the analysis of data from retrospective studies of disease.Journal of the National Cancer Institute 22, pp. 719–748. |
8,802
|
Litchfield, J. T., Wilcoxon, F. A. (1949) A simplified method of evaluating dose- effect experiments. Journal of Pharmacological and Experimental Therapeutics 96, pp. 99–113. |
8,720
|
Peto, R., Pike, M. C., Armitage, P., Breslow, N. E., Cox, D. R., Howard, S. V., Mantel, N., McPherson, K., Peto, J. & Smith, K. G. (1977) Design and analysis of randomized clinical trials requiring prolonged observation of each patient. Part II. Analysis and examples. British Journal of Cancer 35, pp. 1–39. |
6,579
|
Mantel, N. (1966) Evaluation of survival data and two new rank order statistics arising in its consideration. Cancer Chemotherapy Reports 50, pp. 163–170. |
6,408
|
Trong các nhà khoa học Việt cũng có những người có những công trình có ảnh hưởng lớn. Người Việt trong ngành toán có ảnh hưởng lớn nhất nhưng âm thầm nhất có lẽ là Giáo sư Huỳnh Huynh (ĐH South Carolina). Một công trình công bố năm 1970 trên JASA (tập san khoa học thống kê số 1 trên thế giới) được trích dẫn gần 800 lần, là một trong những công trình trở thành tài liệu tham khảo cho bất cứ bài báo nào viết về repeated ANOVA, bất cứ chương trình máy tính dùng cho phân tích thống kê. Một công trình toán học khác của ông (nhưng đăng trên tập san về giáo dục) được trích dẫn trên 1000 lần cũng thuộc vào nhóm “top cited”. Có lẽ ông là nhà toán học gốc Việt Nam duy nhất có công trình nghiên cứu với trên 1000 trích dẫn.
Tóm lại, trong số hàng triệu công trình nghiên cứu, chỉ có khoảng 17 trên 100,000 công trình là thuộc vào nhóm top-cited (tức có ảnh hưởng lớn). Những công trình có ảnh hưởng lớn thường xuất phát từ Mĩ, và công bố trên những tập san lớn nhưScience, Nature, và New England Journal of Medicine. Có ít nhất một người Việt cũng có đóng góp vào những công trình top-cited nhưng là người Việt ở Mĩ. Những công trình này không hẳn là “đột phá” trong khoa học, nhưng không có những công trình này thì các khoa học khác khó có đột phá thật sự.
Tham khảo:
Ho YS. The top-cited research works in the Science Citation Index Expanded. Scientometrics 2013;94:1297-1312
Mark Bauerlein, et al. We Must Stop the Avalanche of Low-Quality Research . The Chronicle of Higher Ed 13/6/2010.
Không có nhận xét nào:
Đăng nhận xét