Bởi Robin Marks
Công nghệ có thể dẫn đến giao tiếp tự nhiên hơn cho
những người bị mất khả năng nói
Các nhà nghiên cứu tại UC San Francisco đã phát triển thành công một “cơ
chế thần kinh nói” cho phép một người đàn ông bị liệt nặng có thể giao tiếp
thành câu, dịch các tín hiệu từ não của anh ta sang đường thanh âm trực tiếp
thành các từ xuất hiện dưới dạng văn bản trên màn hình.
Thành tựu, được phát triển với sự hợp tác của người tham gia đầu tiên của
Thành tựu, được phát triển với sự hợp tác của người tham gia đầu tiên của
một thử nghiệm nghiên cứu lâm sàng, được xây dựng dựa trên nỗ lực hơn
một thập kỷ của bác sĩ phẫu thuật thần kinh Edward Chang, MD của UCSF ,
nhằm phát triển một công nghệ cho phép những người bị liệt có thể giao tiếp
ngay cả khi họ không thể để nói chuyện của riêng họ. Nghiên cứu xuất hiện
Eddie Chang phẫu thuật não. Ảnh của Barbara Ries
“Theo hiểu biết của chúng tôi, đây là minh chứng thành công đầu tiên về việc
“Theo hiểu biết của chúng tôi, đây là minh chứng thành công đầu tiên về việc
giải mã trực tiếp các từ đầy đủ từ hoạt động não của một người bị liệt và
không thể nói,” Chang, Chủ tịch Joan và Sanford Weill của Phẫu thuật Thần
kinh tại UCSF, Giáo sư Jeanne Robertson cho biết. , và tác giả cao cấp của
nghiên cứu. “Nó cho thấy lời hứa mạnh mẽ trong việc khôi phục giao tiếp
bằng cách khai thác vào máy móc lời nói tự nhiên của não.”
Mỗi năm, hàng ngàn người mất khả năng nói do đột quỵ, tai nạn hoặc bệnh
Mỗi năm, hàng ngàn người mất khả năng nói do đột quỵ, tai nạn hoặc bệnh
tật. Với sự phát triển hơn nữa, cách tiếp cận được mô tả trong nghiên cứu
này một ngày nào đó có thể cho phép những người này giao tiếp hoàn toàn.
Chuyển tín hiệu não thành giọng nói
Trước đây, công việc trong lĩnh vực thẩm mỹ thần kinh giao tiếp đã tập trung
Trước đây, công việc trong lĩnh vực thẩm mỹ thần kinh giao tiếp đã tập trung
vào việc khôi phục giao tiếp thông qua các phương pháp tiếp cận dựa trên
chính tả để gõ từng chữ cái một trong văn bản. Nghiên cứu của Chang khác
với những nỗ lực này ở một khía cạnh quan trọng: nhóm của ông đang dịch
các tín hiệu nhằm điều khiển các cơ của hệ thống thanh âm để nói các từ,
chứ không phải là các tín hiệu di chuyển cánh tay hoặc bàn tay để kích hoạt
gõ. Chang cho biết cách tiếp cận này khai thác các khía cạnh tự nhiên và linh
hoạt của lời nói và hứa hẹn giao tiếp hữu cơ và nhanh chóng hơn.
“Với giọng nói, chúng ta thường truyền đạt thông tin với tốc độ rất cao, lên
“Với giọng nói, chúng ta thường truyền đạt thông tin với tốc độ rất cao, lên
đến 150 hoặc 200 từ mỗi phút,” ông nói và lưu ý rằng các phương pháp dựa
trên chính tả bằng cách sử dụng gõ, viết và điều khiển con trỏ chậm hơn và
tốn nhiều công sức hơn. “Đi thẳng vào lời nói, như chúng ta đang làm ở đây,
có lợi thế lớn vì nó gần với cách chúng ta nói bình thường hơn.”
Trong thập kỷ qua, sự tiến bộ của Chang đối với mục tiêu này đã được tạo điều
kiện thuận lợi bởi các bệnh nhân tại Trung tâm Động kinh UCSF đang trải qua
phẫu thuật thần kinh để xác định nguồn gốc của các cơn co giật bằng cách sử
dụng các mảng điện cực đặt trên bề mặt não của họ. Những bệnh nhân này,
tất cả đều có giọng nói bình thường, tình nguyện được phân tích các bản ghi
âm não của họ về hoạt động liên quan đến giọng nói. Thành công ban đầu với
những bệnh nhân tình nguyện này đã mở đường cho thử nghiệm hiện tại ở
những người bị liệt.
Trước đây, Chang và các đồng nghiệp tại Viện Khoa học Thần kinh UCSF Weill
Trước đây, Chang và các đồng nghiệp tại Viện Khoa học Thần kinh UCSF Weill
những phát hiện đó thành nhận dạng giọng nói của các từ đầy đủ, David
Moses, Tiến sĩ, một kỹ sư sau tiến sĩ tại phòng thí nghiệm Chang và là một
trong những tác giả chính của nghiên cứu mới, đã phát triển các phương pháp
mới để giải mã thời gian thực của các mẫu đó và các mô hình ngôn ngữ
thống kê để cải thiện độ chính xác.
Nhưng thành công của họ trong việc giải mã giọng nói ở những người tham
gia có khả năng nói không đảm bảo rằng công nghệ này sẽ hoạt động ở một
người bị liệt thanh quản. Moses nói: “Các mô hình của chúng tôi cần thiết để
học cách lập bản đồ giữa các mô hình hoạt động
phức tạp của não và lời nói dự định. "Điều đó đặt ra một thách thức lớn khi
người tham gia không thể nói."
Ngoài ra, nhóm nghiên cứu không biết liệu các tín hiệu não kiểm soát thanh
Ngoài ra, nhóm nghiên cứu không biết liệu các tín hiệu não kiểm soát thanh
quản có còn nguyên vẹn đối với những người không thể cử động cơ thanh
quản trong nhiều năm hay không. Moses nói: “Cách tốt nhất để tìm hiểu xem
điều này có thể hoạt động hay không là thử nó 50 từ đầu tiên
Để điều tra tiềm năng của công nghệ này ở những bệnh nhân bị liệt, Chang đã
hợp tác với đồng nghiệp Karunesh Ganguly , MD, PhD, một phó giáo sư thần
kinh học, để khởi động một nghiên cứu được gọi là “BRAVO” (Phục hồi giao
diện não-máy tính của cánh tay và giọng nói). Người đầu tiên tham gia thử
nghiệm là một người đàn ông ngoài 30 tuổi, người đã bị đột quỵ não tàn khốc
hơn 15 năm trước, làm tổn thương nghiêm trọng kết nối giữa não với thanh
quản và các chi. Kể từ khi bị thương, anh ấy đã rất hạn chế cử động đầu, cổ
và chân tay, và giao tiếp bằng cách sử dụng một con trỏ gắn trên mũ bóng
chày để chọc các chữ cái trên màn hình.
Người tham gia, người được yêu cầu được gọi là BRAVO1, đã làm việc với các
Người tham gia, người được yêu cầu được gọi là BRAVO1, đã làm việc với các
nhà nghiên cứu để tạo ra một từ vựng 50 từ mà nhóm của Chang có thể nhận
ra từ hoạt động của não bằng các thuật toán máy tính tiên tiến. Vốn từ vựng -
bao gồm các từ như “nước”, “gia đình” và “tốt” - đủ để tạo ra hàng trăm câu
thể hiện các khái niệm áp dụng cho cuộc sống hàng ngày của BRAVO1.
Đối với nghiên cứu, Chang đã phẫu thuật cấy ghép một dãy điện cực mật độ
Đối với nghiên cứu, Chang đã phẫu thuật cấy ghép một dãy điện cực mật độ
cao lên vỏ não vận động cơ lời nói của BRAVO1. Sau khi người tham gia hồi
phục hoàn toàn, nhóm của ông đã ghi lại 22 giờ hoạt động của dây thần kinh
trong vùng não này trong 48 phiên và vài tháng.
Trong mỗi phiên, BRAVO1 cố gắng nói mỗi trong số 50 từ vựng nhiều lần
trong khi các điện cực ghi lại các tín hiệu não từ vỏ não nói của anh ta.
Dịch bài phát biểu đã cố gắng thành văn bản
Để dịch các mô hình hoạt động thần kinh được ghi lại thành các từ cụ thể, hai
Để dịch các mô hình hoạt động thần kinh được ghi lại thành các từ cụ thể, hai
tác giả chính khác của nghiên cứu, Sean Metzger, MS và Jessie Liu, BS, cả hai
nghiên cứu sinh tiến sĩ kỹ thuật sinh học tại Phòng thí nghiệm Chang đã sử
dụng các mô hình mạng nơ-ron tùy chỉnh, là các dạng của trí tuệ nhân tạo.
Khi người tham gia cố gắng nói, các mạng này phân biệt các mô hình tinh tế
trong hoạt động của não để phát hiện các nỗ lực nói và xác định những từ
mà anh ta đang cố gắng nói.
Để kiểm tra cách tiếp cận của họ, đầu tiên nhóm trình bày BRAVO1 với các câu
ngắn được xây dựng từ 50 từ vựng và yêu cầu anh ta thử nói chúng vài lần.
Khi anh ấy thực hiện các nỗ lực của mình, các từ đã được giải mã từ hoạt
động não của anh ấy, từng từ một, trên màn hình.
Sau đó, nhóm chuyển sang nhắc anh ta bằng những câu hỏi như "Hôm nay
Sau đó, nhóm chuyển sang nhắc anh ta bằng những câu hỏi như "Hôm nay
anh thế nào?" và "Bạn có muốn một ít nước không?" Như trước đó, bài phát
biểu cố gắng của BRAVO1 xuất hiện trên màn hình. "Tôi rất khỏe" và "Không,
tôi không khát."
Nhóm nghiên cứu phát hiện ra rằng hệ thống có thể giải mã các từ từ hoạt
Nhóm nghiên cứu phát hiện ra rằng hệ thống có thể giải mã các từ từ hoạt
động của não với tốc độ lên đến 18 từ mỗi phút với độ chính xác lên đến 93
phần trăm (trung bình 75 phần trăm). Góp phần vào thành công là mô hình
ngôn ngữ mà Moses áp dụng đã triển khai chức năng “tự động sửa lỗi”,
tương tự như những gì được sử dụng bởi phần mềm nhắn tin và nhận dạng
giọng nói của người tiêu dùng.
Môi-se đã mô tả các kết quả xét xử ban đầu như một bằng chứng về nguyên
Môi-se đã mô tả các kết quả xét xử ban đầu như một bằng chứng về nguyên
tắc. Ông nói: “Chúng tôi rất vui mừng khi thấy sự giải mã chính xác của một
loạt các câu có ý nghĩa. “Chúng tôi đã chứng minh rằng thực sự có thể tạo
điều kiện giao tiếp theo cách này và nó có tiềm năng sử dụng trong các cài
đặt trò chuyện.”
Jessie Liu, BS, David Moses, Tiến sĩ và Sean Metzger, MS.
Về phía trước, Chang và Moses cho biết họ sẽ mở rộng thử nghiệm để bao
Jessie Liu, BS, David Moses, Tiến sĩ và Sean Metzger, MS.
Về phía trước, Chang và Moses cho biết họ sẽ mở rộng thử nghiệm để bao
gồm nhiều người tham gia hơn bị ảnh hưởng bởi chứng tê liệt trầm trọng và
thiếu hụt giao tiếp. Nhóm hiện đang làm việc để tăng số lượng từ trong kho từ
vựng có sẵn, cũng như cải thiện tốc độ nói.
Cả hai đều nói rằng trong khi nghiên cứu tập trung vào một người tham gia
Cả hai đều nói rằng trong khi nghiên cứu tập trung vào một người tham gia
duy nhất và vốn từ vựng hạn chế, những hạn chế đó không làm giảm thành
tích. Moses nói: “Đây là một cột mốc công nghệ quan trọng đối với một người
không thể giao tiếp một cách tự nhiên, và nó cho thấy tiềm năng của phương
pháp này để mang lại tiếng nói cho những người bị liệt nặng và mất khả năng
nói.”
Tác giả: Danh sách tác giả đầy đủ là David A. Moses, Tiến sĩ *; Sean L. Metzger,
MS *; Jessie R. Liu, BS *; Gopala K. Anumanchipalli, Tiến sĩ; Joseph G. Makin,
Tiến sĩ; Pengfei F. Sun, Tiến sĩ; Josh Chartier, Tiến sĩ; Maximilian E. Dougherty
, Cử nhân; Patricia M. Liu, MA; Gary M. Abrams, MD; Adelyn Tu-Chan, DO;
Karunesh Ganguly, MD, Tiến sĩ; và Edward F. Chang, MD, tất cả UCSF.
Các nguồn tài trợ bao gồm Viện Y tế Quốc gia (U01 NS098971-01), hoạt động
từ thiện và thỏa thuận nghiên cứu được tài trợ với Facebook Reality Labs
(FRL), hoàn thành vào đầu năm 2021. * Biểu thị mức đóng góp ngang nhau.
Tài trợ: Được hỗ trợ bởi một hợp đồng nghiên cứu theo Thỏa thuận Nghiên
Tài trợ: Được hỗ trợ bởi một hợp đồng nghiên cứu theo Thỏa thuận Nghiên
cứu Học thuật được Tài trợ của Facebook, Viện Y tế Quốc gia (cấp NIH U01
DC018671-01A1), Joan và Sandy Weill và Quỹ Gia đình Weill, Quỹ Bill và
Susan Oberndorf, William K. Bowes , Jr. Foundation, và Shurl and Kay Curci
Fundation. Các nhà nghiên cứu của UCSF đã tiến hành tất cả các thiết kế,
thực hiện, phân tích dữ liệu và báo cáo thử nghiệm lâm sàng. Dữ liệu của
người tham gia nghiên cứu chỉ được thu thập bởi UCSF, được giữ bí mật và
không được chia sẻ với bên thứ ba. FRL đã cung cấp phản hồi cấp cao và lời
khuyên về máy học.
Giới thiệu về UCSF: Đại học California, San Francisco (UCSF) tập trung độc
quyền vào khoa học sức khỏe và nỗ lực thúc đẩy sức khỏe trên toàn thế giới
thông qua nghiên cứu y sinh tiên tiến, giáo dục trình độ sau đại học về khoa
học đời sống và sức khỏe cũng như sự xuất sắc trong chăm sóc bệnh nhân.
UCSF Health, đóng vai trò là trung tâm y tế học thuật chính của UCSF, bao
gồm các bệnh viện chuyên khoa được xếp hạng hàng đầu và các chương trình
lâm sàng khác, và có các chi nhánh trên toàn Vùng Vịnh. Trường Y khoa UCSF
cũng có một cơ sở trong khu vực ở Fresno. Tìm hiểu thêm tại ucsf.edu hoặc
xem Tờ thông tin của chúng tôi ..
H.Phi chuyển
H.Phi chuyển
Không có nhận xét nào:
Đăng nhận xét