18 thg 12, 2015

Nhận dạng những công trình nghiên cứu có ảnh hưởng lớn

Nhận dạng những công trình nghiên cứu có ảnh hưởng lớn

http://researchanalytics.thomsonreuters.com/i/highlycited_image690.jpgTrong khoa học, có những công trình dù không được giải thưởng gì quan trọng, nhưng lại gây ảnh hưởng rất lớn. “Ảnh hưởng” ở đây hiểu theo nghĩa được nhiều đồng nghiệp trích dẫn. Do đó, một thước đo quan trọng để đánh giá tầm ảnh hưởng của công trình khoa học là qua chỉ số trích dẫn. Trong một phân tích mà tôi điểm qua dưới đây cho thấy trong số hàng triệu công trình nghiên cứu, chỉ có khoảng 0.017% được xem là có ảnh hưởng lớn. Phần lớn những công trình này xuất phát từ Mĩ.


Trong thế giới khoa học, số lượng không quan trọng bằng chất lượng. Công bố nhiều công trình nghiên cứu là một phản ảnh về mức độ hoạt động (research activity). Mức độ hoạt động có thể chịu ảnh hưởng bởi các yếu tố mang tính cấu trúc, như đầu tư, cơ sở vật chất, v.v. Nhưng một khía cạnh khác còn quan trọng hơn mức độ hoạt động là chất lượng nghiên cứu. Một đại học có thể có ít nghiên cứu, nhưng nếu đó là những nghiên cứu có tầm ảnh hưởng lớn, thì sẽ được đánh giá cao. Chẳng hạn như trước đây tôi đã chỉ ra rằng Đại học Quốc gia TPHCM (VNU-HCM) tuy số công bố quốc tế rất thấp so với các đại học trong vùng như Chulalongkorn, Mahidol, hay Malaya, nhưng tầm ảnh hưởng của nghiên cứu của VNU-HCM thì hơn hẳn các đại học trong vùng.

Tầm ảnh hưởng là khái niệm tương đối mới. Có lẽ Eugene Garfield (người sáng lập ISI) là người đầu tiên khởi xướng phương pháp đánh giá khoa học. Theo Garfield, có thể lấy chỉ số trích dẫn làm một thước đo tầm ảnh hưởng của một công trình nghiên cứu. Theo cách đánh giá này, công trình nghiên cứu nào được nhiều trích dẫn là công trình có ảnh hưởng cao.

Nhưng vấn đề đặt ra là lấy ngưỡng nào để đánh giá là “có ảnh hưởng”. Trong một bài báo mới đây, tôi ghi nhận được vài thống kê thú vị: chỉ có 45% những bài báo công bố trên những tập san hàng đầu được trích dẫn trong 5 năm sau đó. Con số mới đây của Péter Jacsó (Online Information Review) cho biết khoảng 41% bài báo công bố trên các tập san hàng đầu được trích dẫn trong thời gian 2002-2006. Nói cách khác, rất nhiều (có thể đến 60%) bài báo không được trích dẫn, có lẽ chẳng gây tác động gì, mà chỉ … tốn giấy mực. Ngay cả được trích dẫn và tham khảo, con số cũng rất khiêm tốn : chỉ có trên dưới 1% bài báo khoa học được trích dẫn hơn 6 lần mà thôi (trong vòng 5 năm). Do đó, có người đề nghị là một bài báo được trích dẫn một cách độc lập (tức không phải chính tác giả tự trích dẫn) hơn 5 lần được xem là "có ảnh hưởng". Những công trình có ảnh hưởng lớn thường có số lần trích dẫn 100 lần trở lên.

Nhưng để đạt đẳng cấp high-cited thì con số 100 chưa đủ. Theo một qui ước chung, những bài có trên 1000 trích dẫn được xem là những công trình top-cited. Nhưng những bài báo đó thuộc nhóm nào, xuất phát từ đâu? Trong một bài báo gần đây trênScientometrics, tác giả Yuh Shan Ho cung cấp cho chúng ta nhiều dữ liệu rất thú vị. Tác giả điểm qua tất cả những bài báo trên 8073 tập san khoa học trong thư mục SCI-E (Science Citation Index - Expanded) từ 1991 đến 2010 (tức 20 năm). Sau đây là tóm lược những dữ liệu chính: 

Số bài có ảnh hưởng lớn. Trong số 21,066,849 bài báo công bố trong thời gian 20 năm, có 3652 bài có trích dẫn trên 1000 lần. Nói cách khác, tỉ lệ số bài báo có ảnh hưởng lớn chỉ 0.017%. Nói cách khác, cứ 100,000 bài công bố, chỉ có 17 bài là có trích dẫn trên 1000 lần. 


Thể loại. Trong số 3652 bài có ảnh hưởng lớn, 70% là những bài báo nguyên thuỷ (original article), và 26% là những bài tổng quan (review). 

Tập san. Không ngạc nhiên khi thấy những tập san lớn như Science, Nature, New England Journal of Medicine, Lancet, PNAS, v.v. là những tập san có nhiều bài có ảnh hưởng lớn. Bảng dưới đây trình bày những tập san có nhiều bài có ảnh hưởng lớn:

Hai mươi tập san hàng đầu có nhiều công trình có ảnh hưởng lớn 

Tập san 
Số bài với trích dẫn trên 1000 lần
Hệ số ảnh hưởng (impact factor) 2010
Science 
406
31.377
Nature 
378
36.104
New England Journal of Medicine 
203
53.486
Cell 
197
32.406
PNAS 
87
9.771
Lancet 
77
33.633
JAMA 
65
30.011
Physical Review Letters 
53
7.622
Journal of Chemical Physics 
27
2.921
Nucleic Acids Research 
26
7.836
Journal of Experimental Medicine 
24
14.776
Nature Genetics 
23
36.377
Nature Medicine 
20
25.430
Physical Review B 
20
3.774
Circulation 
18
14.432
Applied Physics Letters 
18
3.841
Cancer Journal for Clinicians 
17
94.333
Journal of the American Chemical Society 
17
9.023
Journal of Biological Chemistry 
17
5.328
Journal of Molecular Biology 
17
4.008

Quốc gia. Khoảng 70% những công trình có ảnh hưởng lớn là xuất phát từ Mĩ. Những quốc gia có nhiều công trình top-cited là (theo thứ tự): Anh (458 bài), Đức (282), Pháp (227), và Canada (212). Việt Nam không có trong danh sách, nhưng Hàn Quốc, Đài Loan, và Singapore thì có. 

Danh sách 29 nước có công trình top-cited 

Nước 
Số bài với trích dẫn trên 1000 lần
Phần trăm (tính trên tổng số 3652 bài)
Mĩ 
2160
71.0
Anh 
458
15.0
Đức 
282
9.3
Pháp 
227
7.5
Canada 
212
7.0
Nhật 
181
6.0
Hà Lan 
127
4.2
Thuỵ Sĩ 
124
4.1
Ý 
113
3.7
Úc 
96
3.2
Thuỵ Điển 
93
3.1
Bỉ 
69
2.3
Tây Ban Nha 
66
2.2
Do Thái 
58
1.9
Đan Mạch 
56
1.9
Áo 
44
1.5
Phần Lan 
39
1.3
Na Uy 
29
1.0
China 
27
0.89
Nga 
26
0.86
Ấn Độ 
18
0.60
Ba Lan 
15
0.50
Ba Tây 
14
0.46
Hungary 
11
0.36
Hàn Quốc 
10
0.33
Tân Tây Lan 
9
0.30
Singapore 
8
0.26
Đài Loan 
8
0.26
Tiệp 
8
0.26

Trường / viện. Phần lớn các đại học và viện có công trình ảnh hưởng lớn là xuất phát từ Mĩ. Đại học Harvard đứng đầu danh sách các viện/trường có nhiều công trình top-cited. Các đại học kế tiếp là Stanford, Teas, MIT. 

Danh sách 20 trường đại học có công trình top-cited 

Trường 
Số bài với trích dẫn trên 1000 lần
Phần trăm (tính trên tổng số 3652 bài)
Harvard 
231
7.6
Stanford 
120
4.0
Texas 
108
3.6
MIT 
106
3.5
Washington 
97
3.2
UCSD 
87
2.9
UC Berkeley 
85
2.8
Johns Hopkins 
81
2.7
UCSF 
79
2.6
Michigan 
72
2.4
Brigham Hospital 
69
2.3
Yale 
66
2.2
Mass Gen Hospital 
61
2.0
Washington Univ 
61
2.0
Oxford 
59
2.0
UCLA 
58
1.9
NCI 
57
1.9  
Cambridge 
53
1.8
Columbia 
50
1.7
Pennsylvania 
50
1.7

Trong thế giới khoa học, có những người tiếng Anh gọi là quiet achievers – thành công thầm lặng. Họ là những người ít ai biết đến, không có những giải thưởng lớn, nhưng công trình của họ lại gây ảnh hưởng trong khoa học rất lớn. 

Những công trình của họ không hẳn là “đột phá” trong khoa học, nhưng có thể chinh phục về phương pháp giúp cho các ngành khoa học khác phát triển. Chẳng hạn như công trình của Roger Tsien (ĐH Cambridge) tìm ra cách cho phép chúng ta quan sát calcium ion di chuyển trong tế bào; Nicoletta Sacchi (Mĩ) phát triển một phương pháp đơn giản chiết xuất RNA; Bert Vogelstein (ĐH Johns Hopkins) và đồng nghiệp tìm cách phát triển DNA probe mà giới nghiên cứu sinh học dùng ngày nay; Stephen Altschul (Viện ung thư Mĩ) làm ra chương trình máy tính để tìm DNA và proteins; v.v. Những công trình này không mang tính đột phá, nhưng đã giúp cho các nhà khoa học khác đột phát trong nghiên cứu của họ.
Nhưng trong lĩnh vực thống kê học, sau đây là 10 công trình gây ảnh hưởng cực kì lớn trong lịch sử khoa học, với số lần trích dẫn “khủng”: 


Chi tiết bài báo 
Số lần trích dẫn
Kaplan, E. L., Meier, P. (1958) Nonparametric estimation from incomplete observations. Journal of the American Statistical Association 53, pp. 457–481.
38,655
Cox, D. R. (1972) Regression models and life tables. Journal of the Royal Statistical Society, Series B, 34, pp. 187–220.
32,830
Bland, J. M., Altman, D. G. (1986) Statistical methods for assessing agreement between two clinical measurements. Lancet, 1 (8476) pp. 307–310.
25,033
Felsenstein, J. (1985) Confidence limits on phylogenies: an approach using the bootstrap, Evolution 39, pp. 783–791.
21,526
Marquardt, D. W. (1963) An algorithm for least squares estimation of non-linear parameters. Journal of the Society for Industrial and Applied Mathematics 2, pp. 431–441.
17,764
Duncan, D. B. (1955) Multiple range and multiple F-tests. Biometrics 11, pp. 1–42.
14,995
Mantel, N., Haenszel, W. (1959) Statistical aspects of the analysis of data from retrospective studies of disease.Journal of the National Cancer Institute 22, pp. 719–748.
8,802
Litchfield, J. T., Wilcoxon, F. A. (1949) A simplified method of evaluating dose- effect experiments. Journal of Pharmacological and Experimental Therapeutics 96, pp. 99–113.
8,720
Peto, R., Pike, M. C., Armitage, P., Breslow, N. E., Cox, D. R., Howard, S. V., Mantel, N., McPherson, K., Peto, J. & Smith, K. G. (1977) Design and analysis of randomized clinical trials requiring prolonged observation of each patient. Part II. Analysis and examples. British Journal of Cancer 35, pp. 1–39.
6,579
Mantel, N. (1966) Evaluation of survival data and two new rank order statistics arising in its consideration. Cancer Chemotherapy Reports 50, pp. 163–170. 
6,408

Trong các nhà khoa học Việt cũng có những người có những công trình có ảnh hưởng lớn. Người Việt trong ngành toán có ảnh hưởng lớn nhất nhưng âm thầm nhất có lẽ là Giáo sư Huỳnh Huynh (ĐH South Carolina). Một công trình công bố năm 1970 trên JASA (tập san khoa học thống kê số 1 trên thế giới) được trích dẫn gần 800 lần, là một trong những công trình trở thành tài liệu tham khảo cho bất cứ bài báo nào viết về repeated ANOVA, bất cứ chương trình máy tính dùng cho phân tích thống kê. Một công trình toán học khác của ông (nhưng đăng trên tập san về giáo dục) được trích dẫn trên 1000 lần cũng thuộc vào nhóm “top cited”. Có lẽ ông là nhà toán học gốc Việt Nam duy nhất có công trình nghiên cứu với trên 1000 trích dẫn. 

Tóm lại, trong số hàng triệu công trình nghiên cứu, chỉ có khoảng 17 trên 100,000 công trình là thuộc vào nhóm top-cited (tức có ảnh hưởng lớn). Những công trình có ảnh hưởng lớn thường xuất phát từ Mĩ, và công bố trên những tập san lớn nhưScience, Nature, và New England Journal of Medicine. Có ít nhất một người Việt cũng có đóng góp vào những công trình top-cited nhưng là người Việt ở Mĩ. Những công trình này không hẳn là “đột phá” trong khoa học, nhưng không có những công trình này thì các khoa học khác khó có đột phá thật sự.

Tham khảo: 

Ho YS. The top-cited research works in the Science Citation Index Expanded. Scientometrics 2013;94:1297-1312

Mark Bauerlein, et al. We Must Stop the Avalanche of Low-Quality Research . The Chronicle of Higher Ed 13/6/2010.

Không có nhận xét nào:

Đăng nhận xét