Jean-Dominique Bauby đang ở trên đỉnh cao của sự nghiệp vào cái ngày anh lên cơn đột quỵ, bất tỉnh ở vệ đường rồi trở thành một người sống thực vật.
Đó là buổi chiều thứ sáu, ngày 8 tháng 12 năm 1995, người bán hàng vừa giao một chiếc BMW mui trần nhập khẩu từ Đức, tới tận sảnh văn phòng cho Bauby, số 2 đường Rue des Cesvennes, nơi anh đang giữ chức tổng biên tập tờ Elle - tạp chí thời trang nổi tiếng nhất thế giới tại thời điểm đó.
Khoác chiếc áo jacket hiệu Levi's, Bauby bước vào chiếc coupe màu xám bóng bẩy. Radio đang phát bài "A day in the Life" của The Beatles trong khi chiếc BMW lướt qua cầu Pont de Suresnes. Ánh nắng chiếu trên nửa khuôn mặt Bauby, hắt lên từ mặt sông Seine như thể anh đang lái qua một đại lộ dát vàng.
Không giấu được niềm phấn khích, Bauby bất giác nở một nụ cười.
Băng qua công viên Bois de Boulogne, trường đua ngựa Saint-Cloud và bệnh viện Raymond-Poincaré, chiếc BMW phóng ra khỏi ngoại ô Paris như một tấm thảm bay.
Kế hoạch của Bauby là lái xe về nhà, đón cậu con trai 9 tuổi của mình đi ăn tối. Họ dự định sẽ tới nhà hát để xem vở kịch mới của Philippe Arias, sau đó cả hai sẽ thưởng thức món hàu tại một nhà hàng trên đại lộ Place Clichy.
Thế nhưng, buổi tối vui vẻ ấy đã biến thành một ký ức kinh hoàng. Trên đường trở lại thành phố, Bauby nhận ra điều gì đó không ổn. Con đường trước mặt anh, những chiếc xe và đèn pha của chúng cứ lần lượt tách ra làm đôi. Anh không còn xác định được phương hướng nữa.
Mọi thao tác với chiếc BMW của Bauby đều chậm lại, đó là lúc cơn đột quỵ ập đến. Chiếc xe mất lái lao vào lề đường. Đầu Bauby nghẹo hẳn sang một bên, miệng anh méo xệch, hai mắt mở trừng trừng toát lên vẻ kinh hãi tột độ.
Théophile, cậu con trai 9 tuổi của Bauby nhảy xuống xe, chạy về phía ngôi nhà người dì của mình ở gần đó để cầu cứu. Cả hai sau đó đã đưa Bauby vào một bệnh viện hải quân ở Berck-sur-Mer, nơi anh tỉnh lại sau 20 ngày hôn mê chỉ để nhận ra mình đã bị rơi vào trạng thái nhốt trong (Lock-in Syndrome).
Nhốt trong có nghĩa là toàn bộ cơ thể của Bauby đã bị liệt, nhưng thần trí của anh thì hoàn toàn tỉnh táo. Bauby có thể nhìn thấy các bác sĩ đi lại trong phòng, nghe thấy người thân hỏi chuyện mình nhưng không làm cách nào để đáp lại được họ.
Dây thanh quản của anh đã bị vô hiệu hóa, toàn bộ tứ chi và đầu cổ cũng vậy. Cơ mi mắt trái của Bauby là nơi duy nhất anh còn điều khiển được. Nhưng các bác sĩ cho biết sớm muộn, khả năng chớp mắt của Bauby cũng sẽ biến mất. Đó là lúc anh chính thức trở thành một linh hồn bị cầm tù trong thể xác của chính mình.
Hiểu được điều đang trải qua, Bauby đã tận dụng toàn bộ quãng thời gian còn lại để thực hiện những giao tiếp cuối cùng với thế giới. Anh dùng những cái nháy mắt để trả lời câu hỏi "Yes/No", lướt chúng trên bảng chữ cái để cố gắng viết một cuốn hồi ký.
Mỗi 3 tiếng một ngày và 7 ngày một tuần, nhà xuất bản Robert Laffont gửi một biên tập viên tới bên giường bệnh của Bauby. Cô ấy sẽ đọc đi đọc lại bảng chữ cái tiếng Pháp đã được sắp xếp lại theo tần suất xuất hiện giảm dần của các chữ cái.
"E, S, A, R, I, N,…", Bauby chớp mắt để chọn chữ cái mà anh muốn. Tại vị trí mà anh ấy dừng lại, nữ biên tập viên sẽ khi lại chữ cái và cố gắng đoán từ mà Bauby muốn viết. Bằng kỹ thuật này, cô ấy có thể dịch những suy nghĩ của Bauby ra với tốc độ 2 phút/từ, 30 từ/tiếng, 90 từ/ngày.
Sau khoảng 2 tháng và hơn 200.000 lần chớp mắt, cuối cùng, Bauby cũng hoàn thành được một bản thảo dài hơn 130 trang. "The Diving Bell and the Butterfly" (Quả chuông lặn và cánh bướm) được phát hành vào năm 1997 ngay lập tức đã trở thành cuốn sách bán chạy nhất Châu Âu.
Nó chứa đựng những lời tự sự của Jean-Dominique Bauby về cuộc đời của một bệnh nhân bị nhốt trong - tình trạng được ông ví như đang chìm xuống bóng tối của đại dương mênh mông bên trong một quả chuông lặn.
Còn cánh bướm, đại diện cho những cuộc phiêu lưu mà Bauby chỉ còn có thể thực hiện trong trí tưởng tượng của mình. Khi linh hồn anh không còn bị ràng buộc bởi thể xác, Bauby có thể thoát ra ngoài, đi lang thang quanh bệnh viện, vui đùa với lũ trẻ trên bãi biển.
Đôi khi Bauby thấy mình trở về tòa soạn ở phố Rue des Cesvennes, làm việc như một tổng biên tập bận rộn, nhưng đôi khi lại lạc vào trong những suy nghĩ mơ hồ, nơi Bauby hóa thân thành một tay đua F1, một người lính hoặc một vận động viên đua xe đạp…
Mặc dù vậy, cuộc phiêu lưu đến cuối cùng vẫn dẫn anh quay trở lại với thực tế. Trên một chiếc giường bệnh, trong phòng 119 ở Bệnh viện Hải quân Berck-sur-Mer, Bauby lúc này là một người đàn ông gầy gò, không thể cử động mà chỉ có thể suy nghĩ.
Cuốn sách kết thúc bằng câu hỏi như một tiếng thở nhẹ của Bauby vào không trung:
Trong nhiều thập kỷ, các nhà khoa học đã theo đuổi hai chiến lược nhằm giúp những bệnh nhân bị nhốt trong như Bauby thoát được chiếc chuông lặn và giao tiếp với thế giới.
Chiến lược thứ nhất, sử dụng hệ thống quét bảng chữ cái PAS (Partner-assisted scanning) với sự hỗ trợ của một nhà trị liệu ngôn ngữ như trong trường hợp của Bauby. Một phiên bản cải tiến của nó là hệ thống giao tiếp tăng cường và thay thế AAC (Augmentative and alternative communication) – giống với chiếc máy tính mà cố giáo sư Stephen Hawking từng sử dụng.
Trong AAC, vai trò của nhà trị liệu ngôn ngữ được chuyển sang cho máy tính. Nhưng về bản chất, nó vẫn yêu cầu bệnh nhân bị nhốt trong quét qua một loạt các lựa chọn trên màn hình. Để có thể làm vậy, họ cần giữ được ít nhất một bó cơ còn hoạt động được. Đối với Bauby, đó là cơ mí mắt trái, còn Stephen Hawking, đó là cơ gò má.
Tuy nhiên, nhiều bệnh nhân bị nhốt trong đã và sẽ tiến tới một tình trạng gọi là "nhốt hồn", trong đó, họ mất toàn bộ khả năng vận động trên cơ thể. Bệnh nhân thậm chí không thể mở mi mắt để "nói" trên bảng chữ cái PAS được nữa.
Khi chiến lược sử dụng PAS và AAC thất bại, cách duy nhất để giao tiếp được với những bệnh nhân bị nhốt hồn là đọc trực tiếp suy nghĩ của họ - những tín hiệu điện hóa đang phóng ra từ hàng tỷ xynap thần kinh bên trong não bộ mỗi giây.
Một trong những nỗ lực để làm điều đó đã được thực hiện vào tháng 10 năm 2009, bên trong phòng cộng hưởng từ tại một bệnh viện ở Liège, Bỉ:
Martin Monti, một nhà thần kinh học đến từ Đại học California khi đó đang cố gắng đọc suy nghĩ của một bệnh nhân mang số hiệu 23 (BN23). Đó là một nam thanh niên gặp chấn thương sọ não sau tai nạn xe máy và đã sống thực vật trong trạng thái nhốt hồn suốt 5 năm.
Bằng nhiều thí nghiệm chụp cộng hưởng từ chức năng fMRI, Monti đã có thể chứng minh BN23 vẫn còn giữ được ý thức, mặc dù toàn bộ cơ thể anh đã bị liệt. Hôm nay, ông sẽ cố gắng thực hiện một điều gì đó hơn thế: Trò chuyện cùng anh ấy.
Theo một nghĩa nào đó, chiến lược mà Monti sử dụng với máy fMRI rất đơn giản. Chúng ta biết các neuron thần kinh trong não bộ cần oxy để hoạt động. Oxy này được vận chuyển tới não thông qua dòng máu, bên trong các phân tử huyết sắc tố được gọi là hemoglobin.
Hemoglobin thì chứa sắt trong chúng, và bằng cách theo dõi sắt, nam châm điện của máy cộng hưởng từ có thể xây dựng được một bản đồ hoạt động của não bộ trong thời gian thực. Nó biết khu vực nào của não đang hoạt động mạnh hơn các khu vực khác, nhất là khi bạn đang có một suy nghĩ cụ thể.
Ví dụ, khi một người nằm trong máy cộng hưởng từ fMRI tưởng tượng ra khung cảnh họ đang đi bộ xung quanh nhà của mình, ký ức này sẽ kích hoạt một đợt sóng não đột biến trong khu vực hồi hải mã. Đợt sóng não hiện lên trên màn hình fMRI như một đốm sáng mạng mẽ, cho thấy sắt, hemoglobin và oxy đang hội tụ về khu vực này.
Ngược lại, khi ai đó tưởng tượng ra cảnh họ chơi tennis, vùng não bị kích thích mạnh mẽ nhất lại là vỏ não tiền vận động. Trong một nghiên cứu đăng trên tạp chí Science năm 2006, các nhà khoa học đã chứng minh ngay cả một bệnh nhân bị nhốt hồn cũng có khả năng kích hoạt các mô hình hoạt động não bộ này.
Vì vậy, Monti bây giờ muốn biến nó thành một giao thức để nói chuyện với BN23. Để làm được điều đó, ông đã kiên nhẫn giải thích toàn bộ cơ chế cho bệnh nhân của mình nghe, sau đó mời BN23 tham gia vào một bài kiểm tra với một loạt các câu hỏi "Yes/No".
BN23 được yêu cầu: Nếu muốn trả lời "Có", anh cần tưởng tượng ra mình đang chơi một trận tennis để tạo ra tín hiệu fMRI ở vỏ vão vận động. Còn nếu câu trả lời là "Không", anh cần nghĩ về một chuyến đi dạo quanh nhà để làm sáng vùng hồi hải mã.
Bằng các tín hiệu não này, Monti ở phòng điều khiển fMRI có thể nắm bắt được các vệt sáng trên màn hình và hiểu câu trả lời mà bệnh nhân của mình muốn nói. Khi máy fMRI đã được bật, BN23 đã được đặt trong trạng thái sẵn sàng, phía bên kia tấm kính phòng điều khiển, Monti ghé vào micro và đặt câu hỏi đầu tiên cho anh ấy:
"Cha của anh tên là Alexander có phải không?"
Chỉ một vài giây sau, vùng não tiền vận động của BN23 đã sáng lên trên màn hình. Anh ấy dường như đã thực sự nghĩ về trận tennis, vì vậy câu trả lời là "Đúng".
Để chắc chắn đó không phải một tín hiệu nhiễu, Monti lặp lại: "Cha của anh tên là Thomas có phải không?". Lần này, vùng hồi hải mã đã bật sáng. BN23 có thể đang tưởng tượng mình đang đi quanh nhà. Câu trả lời của anh ấy lần này là: "Không phải".
Để thăm dò kỹ hơn, Monti đã liên tục đặt cho BN23 những câu hỏi mới. "Anh có anh em trai không?" – Tennis (Có). "Anh có chị em gái không?" – Ngôi nhà (Không). "Trước khi gặp tai nạn, anh đang đi du lịch ở Mỹ?" – Tennis (Đúng vậy).
Bất kể khi nào một câu hỏi "Yes/No" được đặt ra, BN23 gần như đều có thể hồi đáp ngay lập tức. Màn hình máy fMRI đêm đó đã nhấp nháy liên tục cho đến khi Monti quyết định đặt một câu hỏi: "Anh có muốn được chết không?".
Lần đầu tiên trong đêm thí nghiệm đó, không một câu trả lời rõ ràng nào được đưa ra. Vùng hồi hải mã của BN23 không bật sáng, vỏ não tiền vận động cũng vậy. Tín hiệu fMRI cho thấy mô hình não của anh ấy nhiễu động.
Chắc chắn trong khoảnh khắc đó, BN23 đã có những suy nghĩ phức tạp cho riêng mình. Chỉ có điều, Monti không thể dịch chúng ra thành lời nói. Anh không thể biết BN23 có buồn, có khóc, liệu anh ấy đang thể hiện khao khát được sống hay ước muốn được giải thoát?
BN23 có lẽ cũng không biết phải nói lên suy nghĩ của mình như thế nào? Bởi đó là năm 2009, tất cả những gì một chiếc máy cộng hưởng từ chức năng fMRI làm được là tạo ra một giao thức "Yes/No" với bệnh nhân bị nhốt hồn.
Nó giống như một tiếng gõ, một cú giật giây bên trong chiếc chuông lặn. Dù cho BN23 có khóc thật to và gào thét bên trong suy nghĩ và tưởng tượng của anh ấy, không một ai có thể nghe thấy.
Ngay cả Monti, người đang trực bên máy cộng hưởng từ fMRI cũng chỉ có thể mong chờ một cú giật "Yes" hoặc "No". Nhưng đêm đó, câu trả lời đã không đến.
Suy nghĩ của con người từng được coi là một ngôi đền bất khả xâm phạm. Trong hàng ngàn năm, chúng ta đã phải thừa nhận chỉ có Chúa và các vị thần mới biết được suy nghĩ thực sự bên trong đầu mỗi người.
Các nhà thôi miên, thầy bói và ảo thuật gia chỉ là những người biết cách đánh lừa công chúng rằng họ biết mọi người đang nghĩ gì. Những xảo thuật, từ đọc nguội, đọc nóng cho đến tâm thần luận đã bị khoa học bác bỏ.
Nhưng các nhà khoa học không làm vậy để bảo vệ ngôi đền thiêng liêng chứa tiếng nói nhỏ và những suy nghĩ thầm kín trong đầu chúng ta. Đến lượt mình, chính họ cũng ấp ủ chế tạo được một cỗ máy đọc suy nghĩ.
Năm 1890, Julius Emmner, một nhà phát minh người Mỹ từng lập luận: Nếu như một chiếc máy ghi âm (Phonautograph) có thể biến tiếng nói vô hình thành những bản ghi dao động hữu hình trên giấy, sớm muộn con người cũng có được một cỗ máy biến ý nghĩ vô hình thành văn bản.
Sống ở thời điểm đó, bạn sẽ thấy tuyên bố của Emmner không quá ngạo mạn. Năm 1890, loài người đang ở trên đỉnh cao của cuộc cách mạng công nghiệp lần thứ hai (1870-1914). Những tiến bộ thần kỳ trong khoa học công nghệ đang cho phép họ thực hiện những điều trước đó tưởng chừng là phép thuật.
Điện thoại, những cỗ máy giúp hai người ở hai thành phố trò chuyện trực tiếp với nhau mới được phát minh vào năm 1876. Bóng đèn điện, thứ có thể nhốt ánh sáng vào bên trong một quả cầu để chúng thắp sáng màn đêm được phát minh vào năm 1879.
Và năm 1877, người ta đã tạo ra được một cỗ máy có khả năng tóm những âm thanh vô hình từ không trung, ghi chúng xuống bản khắc kim loại để lưu trữ và phát lại qua màng loa bất cứ lúc nào họ thích.
Vì vậy, khi Emmner nghĩ rằng máy ghi âm là nguyên mẫu cơ bản của một cỗ máy thu được suy nghĩ, điều đó không hẳn là không có cơ sở. Trực giác đã mách bảo ông rằng tiền thân của lời nói cũng chính là suy nghĩ, và cả hai vốn chỉ là thứ vụt qua đúng một lần duy nhất, khi chúng xảy ra mà không bao giờ lặp lại được nữa.
Thế nhưng, điều mà Emmner không ngờ tới là bộ não con người, nơi khởi đầu của mọi suy nghĩ hóa ra phức tạp hơn ông tưởng. Lý do vì đến tận cuối thế kỷ 19, các nhà khoa học vẫn chưa biết tới sự tồn tại của các tế bào thần kinh.
Họ cho rằng não bộ con người chỉ là một mạng lưới liên tục duy nhất. Vì vậy, việc theo dõi hoạt động của nó, lắng nghe và ghi lại những tín hiệu phát ra từ một mạng lưới không hẳn là bất khả thi về mặt công nghệ.
Phải đến tận sau năm 1906, khi bộ đôi nhà khoa học Camillo Golgi người Ý và Santiago Cajal người Tây Ban Nha phát hiện ra các tế bào thần kinh (neuron) và giành được giải Nobel Y học, con người mới dần biết đến quy mô thực sự của não bộ.
Hóa ra, khối bọt biển nặng khoảng 1,8 kg bên trong hộp sọ của bạn đang chứa tới 86 tỷ neuron. Các neuron được mắc nối với nhau thông qua những sợi cáp cực nhỏ được gọi là sợi nhánh và sợi trục.
Mỗi tế bào thần kinh trong não đều là một điểm nút kết nối 100.000 tế bào thần kinh khác xung quanh đó. Khi một tế bào thần kinh bị kích thích, nó sẽ giải phóng các hóa chất được gọi là chất dẫn truyền thần kinh, tạo ra các tín hiệu điện hóa lan truyền đến hàng nghìn tế bào thần kinh lân cận.
Các nhà khoa học biết quá trình phóng thích và lan truyền tín hiệu điện của các mạch neuron là thứ tạo ra suy nghĩ trong não bộ. Nhưng theo dõi, nắm bắt hay thậm chí giải mã được chúng là một điều thực sự khó.
Vấn đề đầu tiên và cũng là khó khăn nhất chính là quy mô. Với khoảng 86 tỷ tế bào thần kinh và mỗi tế bào thần kinh là một điểm nút của 100.000 tế bào thần kinh khác, não bộ con người có tới hơn 100 nghìn tỷ (10 mũ 15) con đường kết nối.
Điều này biến nó trở thành một trong hai cấu trúc phức tạp nhất tồn tại trong vũ trụ. Cấu trúc còn lại chính là vũ trụ với khoảng 100 tỷ thiên hà đã được quan sát thấy. Và trong khi chúng ta chỉ sống trong một vũ trụ, ngay lúc này trên Trái Đất đang có hơn 8 tỷ người, hơn 8 tỷ bộ não đang cùng bắn ra hàng tỷ tín hiệu điện hóa và tạo ra hàng tỷ suy nghĩ mỗi giây.
Vấn đề thứ hai là các neuron trong não bộ cực kỳ nhạy cảm. Chúng có thể bị kích thích bởi bất cứ điều gì. Trong vòng vài trăm mili giây, không ai biết tại sao và một neuron ở đâu trong số 86 tỷ tọa độ lại bị kích hoạt, tạo ra một làn sóng điện hóa lan truyền hình thành một suy nghĩ.
Các yếu tố ngoại cảnh, thâm nhập vào thị giác, thính giác, xúc giác của bạn có thể kích hoạt một suy nghĩ. Các yếu tố nội tại cơ thể, như cơn đói, cơn buồn ngủ hoặc cảm giác đau lại kích hoạt một dạng suy nghĩ khác. Và có cả những suy nghĩ dường như tự nhiên nảy sinh từ vô thức, tiềm thức hay ký ức tự truyện của bạn.
Việc lần theo dấu một suy nghĩ giống như khi bạn đứng trước một khu rừng và tự hỏi nó đã bắt đầu từ đâu? Từ chiếc lá đầu tiên hay chiếc rễ đầu tiên? Quan sát thấy một suy nghĩ xuyên qua hàng tỷ kết nối neuron trong vòng vài trăm mili giây giống như bạn đang cố gắng nhìn thấy toàn bộ lá rừng, rễ cây, chim, rắn, bọ ve và hươu nai cùng một lúc.
Với kiến thức và công nghệ của thế kỷ 19, chắc chắn, không một ai và không một cỗ máy nào có thể giúp con người làm được điều đó.
Julius Emmner, nếu muốn, sẽ phải đợi đúng 100 năm để chứng kiến sự ra đời của một công nghệ bắt kịp với ý tưởng vượt thời gian của ông.
Năm 1990, trong một bài báo đăng trên Kỷ yếu Viện Hàn lâm Khoa học Hoa Kỳ, Seiji Ogawa, một nhà sinh lý và thần kinh học người Nhật Bản đã trình bày một phương pháp sử dụng máy cộng hưởng từ để theo dõi hoạt động não trong thời gian thực.
Phương pháp này dựa trên nồng độ oxy máu được gọi là BOLD (Blood Oxygen Level Dependent) không xâm lấn, không cần dùng thuốc cản quang mà chỉ dựa hoàn toàn vào trạng thái sinh lý tự nhiên của não bộ.
Để hiểu về BOLD, trước tiên, chúng ta phải nói về nguyên lý hoạt động của máy cộng hưởng từ (MRI). Cỗ máy thực chất là một nam châm điện khổng lồ hình trụ rỗng, nơi một bệnh nhân được đặt nằm cố định vuông góc bên trong đó.
Khi nam châm điện phát ra một từ trường siêu mạnh, cỡ 3-4 Tesla, tương đương với 50.000 lần so với từ trường Trái Đất, toàn bộ các phân tử trong cơ thể bệnh nhân đang cố định ở vị trí xoay theo trạng thái từ tự nhiên của chúng sẽ bị kéo xoay về hướng song song với từ trường của máy quét.
Sau đó, một cuộn dây RF sẽ phóng một sóng vô tuyến xuyên qua một lát cắt của não. Sóng vô tuyến này làm nhiễu từ trường và khiến các phân tử trên lát cắt xoay lệch ra khỏi hướng song song.
Tùy loại phân tử mà độ xoay này sẽ khác nhau. Để khi cuộn dây RF bị tắt, các phân tử khác nhau sẽ xoay trở lại hướng song song của từ trường ngoài và phát trả lại các sóng vô tuyến có tần số khác nhau.
Thông thường, các sóng vô tuyến mà một phân tử phát ra sẽ cực kỳ nhỏ. Nhưng bởi các phân tử cùng loại sẽ phát ra sóng cùng loại, chúng tạo thành một sóng cộng hưởng lớn mà cảm biến của máy MRI có thể thu lại được.
Các tín hiệu này được giải mã bằng thuật toán được hiệu chỉnh từ trước, sau đó sẽ cho ra hình ảnh của lát cắt trên cuộn dây RF. Bằng cách di chuyển cuộn RF rồi ghép tất cả các lát cắt lại với nhau, MRI sẽ cho ra hình ảnh của bộ não.
Khác với chụp X-quang thông thường chỉ phân biệt được mô cứng (xương) và các mô mềm còn lại trên cơ thể, MRI có khả năng phân biệt cả các mô mềm với độ phân giải lên tới hơn 250 loại phân tử khác nhau.
Kể từ khi được phát minh vào năm 1977, MRI cho đến nay vẫn là kỹ thuật chụp ảnh não bộ hiện đại nhất mà con người có được. Nó cho phép các bác sĩ phát hiện nhiều bất thường trong bộ não, chẳng hạn như một vết nứt trên hộp sọ, một mạch máu đang phình ra hay một khối u đang hình thành.
Tuy nhiên, nếu chỉ dựa trên nguyên lý đã trình bày, MRI chỉ có thể tạo ra hình ảnh não ở trạng thái tĩnh. Cỗ máy cho phép chúng ta nhìn thấy cấu trúc hữu hình của của não bộ. Nói cách khác, khi bạn mổ bộ não ra và nhìn thấy cái gì, thì một cỗ máy MRI sẽ giúp bạn nhìn thấy thứ đó mà không cần mổ não.
Suy nghĩ- như chúng ta đã nói là những tín hiệu vô hình phát ra từ các neuron trong trạng thái động – bạn không thể mổ một bộ nào ra và mong sẽ nhìn thấy suy nghĩ như một thực thể bên trong nó. Do đó, MRI không thể giúp bạn nhìn thấy suy nghĩ.
Đây là lúc mà phương pháp BOLD của Seiji Ogawa có mặt, nó là một phương pháp tinh chỉnh máy MRI để chỉ tập trung vào một loại tín hiệu động của não: quá trình cung cấp oxy cho neuron thần kinh.
Giống như mọi tế bào khác trong cơ thể, Ogawa cho biết các tế bào thần kinh cũng cần năng lượng để hoạt động. Neuron tạo ra năng lượng này bằng cách sử dụng oxy để phân giải đường. Trong một khoảnh khắc, những neuron nào hoạt động càng mạnh thì sử dụng càng nhiều oxy dẫn đến hiện tượng các mao mạch gần chúng giãn ra để đẩy nhiều oxy hơn vào tế bào.
Ogawa đề xuất phương pháp dựa trên nồng độ oxy máu (Blood Oxygen Level Dependent - BOLD) để theo dõi hoạt động thần kinh của não bộ, từ một thực tế rằng lưu lượng oxy tới các neuron có thể tăng tới 60% ngay cả khi não bộ thực hiện một suy nghĩ đơn giản như gõ nhẹ các ngón tay trên bàn.
Nhưng làm thế nào để đo được nồng độ oxy? Hóa ra, Ogawa đã dựa vào từ tính của sắt có trong các phân tử huyết sắc tố hemoglobin. Khi hemoglobin mang oxy tới neuron, chúng thể hiện tính chất nghịch từ. Sau khi nhả oxy vào tế bào thần kinh, chúng trở lại trạng thái thuận từ.
Bằng cách tập trung tần số vô tuyến (RF) và các thuật toán để giải mã sự biến thiên của hemoglobin, máy MRI lúc này có thể gián tiếp theo dõi được hoạt động của các tế bào thần kinh trong thời gian thực.
Ogawa đặt ra thuật ngữ cộng hưởng từ chức năng (fMRI) để nói về quá trình này, thứ cho ông biết chính xác các neuron ở vùng não nào đang hoạt động mạnh, bật sáng trên màn hình, khi một bệnh nhân thực hiện một chức năng não bộ nào, từ điều khiển một ngón tay cho đến khi họ tập trung suy nghĩ.
Điều này hơi giống với việc tìm ra vị trí và thời điểm một tia sét đã xảy ra bằng cách lắng nghe tiếng sấm và ánh chớp của nó. Tuy nhiên, fMRI thực sự là phương pháp tốt nhất mà chúng ta đang có thể khiến những suy nghĩ vô hình trở nên hữu hình.
Bước tiếp theo chỉ là tìm cách giải mã tín hiệu fMRI để hiểu được chúng.
Năm 1998, tại một bệnh viên dành cho cựu chiến binh Hoa Kỳ, Johnny Ray, 53 tuổi, đang nằm trong cỗ máy cộng hưởng từ chức năng (fMRI). Đó là tháng thứ 14, sau khi một mạch máu ở thân não của Ray bị vỡ ra, kích hoạt cơn đột quỵ và đưa ông vào tình trạng nhốt trong.
Nước Mỹ có thêm một bệnh nhân phải thở máy, nằm liệt giường và chỉ có thể chớp mắt để giao tiếp - 2 lần để nói "Có" và 1 lần để nói "Không".
Ray, người sau đó đã chớp mắt hai lần khi được Philip Kennedy, một nhà thần kinh học tại Viện công nghệ Georgia đề nghị tham gia vào một thử nghiệm mang tính đột phá – thứ hứa hẹn sẽ lấy lại được khả năng giao tiếp cho ông ấy.
Thí nghiệm bắt đầu bằng một phiên quét não bằng fMRI. Khi Ray đã nằm cố định trong cỗ máy, Kennedy yêu cầu ông tưởng tượng ra cảnh mình đang cử động bàn tay – mặc dù thực tế là ông không thể.
Bất chấp điều đó, tưởng tượng của Ray đã kích hoạt các neuron tại một vùng trên vỏ não vận động. Chúng sáng lên trên màn hình fMRI. Kennedy cẩn thận đánh dấu lại vùng não đó, khẳng định đây chính là nơi mà các xung thần kinh đại diện cho suy nghĩ điều khiển bàn tay của Ray khởi nguồn.
Ở các bệnh nhân bị nhốt trong, những tín hiệu này vẫn tồn tại, chỉ có điều, con đường thần kinh dẫn chúng xuống bàn tay đã bị phá hủy. Đó là lý do khiến các bệnh nhân có thể tưởng tượng, nhưng không còn khả năng điều khiển cơ thể mình được nữa.
Bây giờ, Kennedy muốn trích xuất các tín hiệu từ vùng vỏ não vận động của Ray và giúp ông thực hiện một màn ảo thuật: Điều khiển đồ vật bằng ý nghĩ - đồ vật ở đây chính là con trỏ chuột của một chiếc máy tính.
Để làm được điều đó, Kennedy đã mở hộp sọ của Ray rồi cấy hai điện cực hình nón vào vùng vỏ não vận động mà ông đã đánh dấu. Các điện cực này là phát minh độc quyền của Kennedy, có khả năng thu nhận tín hiệu xung điện từ neuron thần kinh tại vị trí được cấy ghép.
Tín hiệu điện sau đó được truyền qua một dây dẫn bằng vàng, ra một máy phát vô tuyến cấy trên đỉnh sọ của bệnh nhân, trước khi được khuếch đại và chuyển tiếp không dây tới một máy tính.
Trên màn hình máy tính được đặt trước mặt của Ray, Kennedy đã cài sẵn chương trình gõ chính tả với một bàn phím ảo và một con trỏ chuột. Nhiệm vụ của Ray bây giờ là tập cách sử dụng suy nghĩ của mình để điều khiển con trỏ, nhấn để chọn các phím ảo trên màn hình và đánh vần từng từ mà ông muốn nói.
Nghe có vẻ đơn giản, nhưng đừng quên đó là công nghệ của năm 1998. Chỉ có hai điện cực áp thẳng lên vùng vỏ não vận động của bệnh nhân. Nó giống như bạn áp tai vào một quả chuông chứa trong đó hàng ngàn con ong đang bay và nhiệm vụ của bạn là phải tìm ra một con ong mục tiêu duy nhất.
Trong trí tưởng tượng, Ray đã phải duyệt qua hàng ngàn cử động mà anh có thể làm với bàn tay của mình để tìm ra được một tưởng tượng mà với suy nghĩ về nó, anh có thể dịch chuyển con trỏ chuột sang phải một chữ cái.
Vì vậy, quá trình không đơn giản là bạn nghĩ "Sang phải" và con trỏ chuột sẽ nhảy sang phải ngay lập tức. Bạn phải thử những tưởng tượng đại loại như: "Nhấc tay phải lên cao" – con trỏ không nhúc nhích, "Gạt tay phải sang phải thật mạnh" – con trỏ bay ra khỏi màn hình, "Nhẹ nhàng nhấc ngón tay giữa của tay phải rồi đặt nó xuống" – con trỏ trượt đi rồi trượt lại…
Cứ thế 20 phút mỗi ngày, 3 ngày mỗi tuần và liên tục trong 9 tháng, Ray mới tìm ra được một tín hiệu giúp anh kiểm soát được con trỏ chuột và viết ra tên mình trên màn hình: "JOHN".
Bốn chữ cái được gõ ra trong vòng 6 phút, Ray đã ghi được tên mình vào lịch sử khi trở thành người đầu tiên giao tiếp thành công với máy tính mà chỉ dùng đến suy nghĩ. Hai điện cực mà ông được cấy vào não bộ cũng trở thành giao diện não – máy tính (Brain Computer Interface – BCI) có chức năng điều khiển chuyển động đầu tiên trong lịch sử.
Hai thập kỷ sau đó chứng kiến những bước đột phá mà các nhà khoa học đạt được trong lĩnh vực BCI. Số lượng các nghiên cứu và thử nghiệm trong lĩnh vực này tăng từ 20 nghiên cứu vào năm 1998 lên hơn 750 nghiên cứu vào năm 2020.
Bằng cách cấy ghép các điện cực ngày càng mỏng, với số lượng ngày càng dày đặc vào vùng vỏ não vận động của bệnh nhân bị nhốt trong, các nhà khoa học đã có thể giúp những người này thoát ra khỏi chiếc chuông lặn của mình, lấy lại khả năng vận động và giao tiếp thông qua giao diện não -máy tính.
Chẳng hạn, vào năm 2020, một hệ thống BCI đã có thể giúp một bệnh nhân người Đức mất 100% cử động trên cơ thể, giao tiếp được với bác sĩ và người thân.
Ca cấy ghép được thực hiện vào tháng 3 năm 2019 tại một bệnh viện ở Munich. Trong đó, các bác sĩ đã cấy 2 con chip vi điện cực có kích thước 1,5 mm vào vỏ não vận động điều khiển các cơ bên trái của bệnh nhân.
Con chip được nối ra ngoài hộp sọ bằng một cổng BCI và rồi kết nối với máy tính để thu nhận các tín hiệu thần kinh của não bộ. Người đàn ông được xuất viện ngay sau 3 ngày hậu phẫu, để bắt đầu quá trình luyện tập nói và đánh vần chỉ bằng suy nghĩ của anh ấy.
Các bác sĩ sử dụng một phần mềm viết bằng Python và C++ để kiểm soát tất cả các phiên tập nói bằng BCI của bệnh nhân. Đầu tiên, anh ấy được hướng dẫn trả lời các câu hỏi "Yes/No" bằng cách bắn các tín hiệu thần kinh cụ thể trong vùng vỏ não.
Sau đó, anh ấy được tập đánh vần từng chữ cái, ghép chúng thành từ và cuối cùng là thành câu hoàn chỉnh. Quá trình tập luyện kéo dài hơn 100 ngày, đến ngày thứ 107, người đàn ông đã nói được một câu đầu tiên: "Tôi muốn gửi lời cảm ơn tới các bác sĩ".
Tương tự, vào tháng 7 năm 2021, một nghiên cứu trên tạp chí Y học New England cũng cho thấy BCI đã giúp một người đàn ông bị đột quỵ lấy lại khả năng nói chuyện sau 15 năm bị liệt từ cổ trở xuống. Bệnh nhân có biệt danh là BRAVO-1 có thể sử dụng suy nghĩ truyền qua máy tính để gõ với tốc độ trung bình 15 từ/phút, độ chính xác đạt khoảng 74%.
Chưa đầy 4 tháng sau đó, một nghiên cứu đăng tải trên tạp chí Nature đã phá vỡ kỷ lục mà BRAVO-1 đạt được. Một bệnh nhân khác biệt danh là T5, cũng bị liệt toàn bộ thân người do chấn thương cột sống, đã có thể giao tiếp bằng máy tính với tốc độ 18 từ/phút, ở độ chính xác lên tới 94% nhờ các điện cực cấy ghép trong vào vùng vỏ não vận động của mình.
Tính tới thời điểm này, giao diện não-máy tính (BCI) hiện đang là một trong những công nghệ lắng nghe não bộ tốt nhất mà con người có được. Nó đang giúp những người bị liệt điều khiển cánh tay robot, những bệnh nhân bị nhốt hồn giao tiếp được trở lại.
Neuralink, một start-up của Elon Musk trong lĩnh vực này còn hứa hẹn việc kết nối não bộ của chúng ta với internet băng thông cao bằng những con chip có 1024 điện cực được "khâu" thẳng vào bề mặt não.
Với BCI, mong ước của Jean-Dominique Bauby về một công nghệ có khả năng giúp những bệnh nhân nhốt hồn như anh thoát khỏi quả chuông lặn đã trở thành hiện thực. Nhưng các hệ thống này có thực sự đọc được suy nghĩ như những gì Julius Emmner mường tượng vào năm 1890 không?
Những con chip BCI, ít nhất cho đến giờ phút này, chỉ là những mảng điện cực bé nhỏ được dán vào vỏ não vận động. Chúng có thể theo dõi những ý nghĩ liên quan đến sự vận động của bệnh nhân.
Điện cực ghi nhận suy nghĩ điều khiển thao tác mà bệnh nhân muốn làm với con trỏ chuột, giúp họ chọn phím và gõ nhưng không thực sự dịch trực tiếp suy nghĩ của họ thành văn bản.
Ví dụ, khi một bệnh nhân gõ chữ "Hello" trên màn hình, suy nghĩ của ông ấy đang thực hiện trong vỏ não vận động không phải là "Xin chào". Thay vào đó, bệnh nhân đang thực hiện một tổ hợp các suy nghĩ bao gồm: "Sang trái", "Sang phải", "Lên trên", "Xuống dưới", "Nhấn" và "Gõ"…
Ý định nói "Xin chào" đã phát sinh trước đó từ một vùng não chịu trách nhiệm cho ngôn ngữ trên vỏ đại não. Một mảng điện cực BCI cấy ghép vào vỏ não vận động không thể đọc được suy nghĩ ở vỏ đại não, chưa kể các suy nghĩ phức tạp hơn như ký ức tự truyện thường được kích hoạt bởi các cụm neuron ở khắp các vùng khác nhau trong não bộ.
Vậy làm thế nào mới có thể đọc trực tiếp được suy nghĩ?
Câu hỏi dẫn chúng ta quay trở lại với những neuron đang sáng lên trên màn hình của máy cộng hưởng từ chức năng fMRI. Nếu như các điện cực BCI chỉ đang giúp chúng ta mở một lỗ nhỏ để nhìn vào các suy nghĩ ở vỏ não vận động của não bộ, fMRI đang làm được một điều vĩ mô hơn thế.
Kỹ thuật này cho phép chúng ta chụp toàn bộ hoạt động của bộ não, tại toàn bộ các vị trí khác nhau, trong thời gian thực.
Vì vậy, nếu mỗi suy nghĩ của bạn đang kích hoạt một tập hợp các tế bào thần kinh cụ thể và khác nhau, về lý thuyết, các nhà khoa học có thể dựa trên tín hiệu cộng hưởng từ chức năng để suy ngược lại xem bạn đang nghĩ gì.
Trên quy mô nhỏ và giới hạn, điều này đã được chứng minh là khả thi.
Trong một nghiên cứu vào năm 2008, Marcel Just, một nhà thần kinh học nhận thức đến từ Đại học Carnegie Mellon đã chứng minh ông có thể đọc được suy nghĩ của các tình nguyện viên nằm trong máy cộng hưởng từ.
Khi tình nguyện viên được cung cấp một cặp cụm từ, ví dụ "cái búa" và "ngôi nhà", "con dao" và "căn hộ", "tuốc nơ vít" và "lâu đài", Just có thể nói chính xác họ đang nghĩ về đối tượng nào dựa trên ảnh chụp fMRI.
Lý do rất đơn giản, các neuron ở các vùng não khác nhau đã được kích hoạt, dựa trên chủ đề mà danh từ được chọn. Một bên là các công cụ, một bên là các ngôi nhà hay nơi trú ẩn. "Khi bạn nghĩ về một chiếc tuốc nơ vít, bạn sẽ nghĩ về cách mình cầm nó, vặn nó ra sao và nó trông như thế nào", Just nói.
Điều này tạo ra các mô hình fMRI ở một số vùng cụ thể trong bộ não, khác với những vùng sẽ bị kích hoạt khi bạn nghĩ về một ngôi nhà, kèm theo cách hành động như bạn sẽ mở cửa nó, đi xung quanh nó, nhìn ngắm nó từ xa ở một khoảng cách lớn.
Mô hình nhị phân trong tín hiệu fMRI này cũng chính là thứ đã giúp Martin Monti thiết lập giao thức trò chuyện "Yes/No" với Bệnh nhân 23, khi anh ấy tưởng tượng ra mình đang chơi tennis, hoặc đi bộ xung quanh nhà.
Nhưng bây giờ, Marcel Just muốn phát triển nó hơn thế. Với chiến lược gắn danh từ với hành động, Just muốn xây dựng được một mô hình máy tính dự đoán để dịch suy nghĩ của con người sang tín hiệu fMRI.
Ông làm điều đó bằng cách lấy mẫu kích hoạt neuron của 60 danh từ cụ thể, chia làm 12 chủ đề khác nhau bao gồm động vật, bộ phận cơ thể, tòa nhà, quần áo, côn trùng, xe cộ và rau quả. Sau đó, mỗi danh từ sẽ được gắn với khoảng 25 động từ liên quan đến chức năng, cảm giác hoặc hành động mà con người có thể làm với chúng.
Kết hợp thông tin quét não liên quan đến tập danh từ và động từ này, mô hình máy tính của Just có thể dự đoán ra ảnh quét não của hàng ngàn từ vựng, bao gồm cả các từ chuyên ngành như "lực hấp dẫn", "động năng", "entropy" với độ chính xác lên tới 75%.
Điều đó có nghĩa là gì? Khi bạn có một suy nghĩ trong đầu, Just có thể đoán được ảnh quét não của bạn sẽ trông như thế nào? Đây là quá trình dịch xuôi từ suy nghĩ sang ảnh chụp fMRI.
Nếu các suy nghĩ này được cho trước và có giới hạn, Just có thể đoán ngược lại bạn đang nghĩ gì như cách chơi một trò chơi trắc nghiệm. Hãy tưởng tượng đó là một màn ảo thuật thế này:
Just cho bạn một chiếc hộp, bên trong đó có 240 lá thăm viết các câu như: "Ông lão ném hòn đá xuống hồ", "Nhà báo phỏng vấn quan tòa", "Lũ lụt tàn phá bệnh viện"… Bạn được yêu cầu bốc một lá thăm, nằm vào máy cộng hưởng từ chức năng rồi mở nó ra đọc thầm.
Tại một căn phòng khác, Just không thể nhìn thấy lá thăm của bạn. Nhưng bằng ảnh chụp từ máy fMRI, ông ấy có thể biết bạn đã bốc được lá thăm nào trong số 240 lá thăm ngẫu nhiên đó với độ chính xác lên tới 83%, gấp hơn 200 lần tỷ lệ đoán bừa của trò trắc nghiệm có 240 lựa chọn.
Tuy nhiên, chúng ta biết con người không chỉ có 240 suy nghĩ. Nghiên cứu cho thấy trung bình, cứ 10 giây sẽ có một suy nghĩ tự động nảy sinh trong não bộ. Con số tương đương với 360 suy nghĩ mỗi giờ, 5.760 suy nghĩ trong khoảng thời gian thức giấc mỗi ngày và 2.102.400 suy nghĩ mỗi năm.
Về cơ bản, số lượng suy nghĩ của con người là vô hạn. Không ai có thể cản bạn nghĩ về một con mèo có tai thỏ, cuộc sống trên Sao Hỏa hay MU vô địch. Điều này gây khó khăn không chỉ cho Just mà cho mọi nhà khoa học có ý định dịch ngược một tín hiệu fMRI ra thành suy nghĩ.
Khi số lượng suy nghĩ là vô hạn còn số lượng neuron thần kinh trong não là hữu hạn, chắc chắn sẽ có những suy nghĩ kích hoạt cùng một mô hình tín hiệu thần kinh và cho ra ảnh chụp fMRI giống nhau.
Những hình ảnh fMRI sẽ càng giống nhau hơn nữa nếu tính đến độ phân giải của chúng. Hiện tại, các cỗ máy cộng hưởng từ của con người mới chỉ đạt được tới độ phân giải 1 voxel – những điểm ảnh 3D đại diện cho mức độ tiêu thụ oxy của các vùng não có kích thước 1x1x1 mm.
Trong mỗi một milimet khối đó của não bộ chứa tới hơn 1 triệu tế bào thần kinh. Do đó, về cơ bản, các cỗ máy fMRI của chúng ta đang hoạt động bên dưới độ phân giải của suy nghĩ 1 triệu lần.
Để so sánh, nó giống như bạn đang cố gắng xem một video 8K (7.680x4.320) qua một chiếc màn hình có độ phân giải 7x5 – bạn không đọc nhầm đâu – đó là 7 pixel chiều ngang và 5 pixel chiều dọc.
Thứ duy nhất cứu vớt được độ giảm phân giải thảm họa này là số lượng neuron mà bộ não đang sở hữu. Với 86 tỷ neuron, não bộ bạn vẫn tạo ra được 86 triệu điểm ảnh voxel trên phim cộng hưởng từ chức năng fMRI.
Chiếu các điểm ảnh voxel 3 chiều này trên một màn hình hai chiều, nó tương đương với việc bạn xem một video có độ phân giải VGA (640x480). Ảnh chụp fMRI hiện tại vì vậy trông khá vỡ.
Có một thực tế mà chúng ta phải thừa nhận, rằng có một chiếc màn hình độ phân giải thấp thì vẫn tốt hơn là không có chiếc màn hình nào.
Bất kỳ ai từng xem một trận bóng đá qua màn hình ngoài trời đều biết những màn hình khổng lồ này được ghép lại từ những bóng LED có độ phân giải còn thấp hơn cả VGA. Nhưng nếu bạn đứng ở một khoảng cách đủ xa, hình ảnh mà chúng tạo ra vẫn có thể chấp nhận được.
Ở một góc quay toàn cảnh của trận bóng, bạn sẽ không thể biết chính xác cầu thủ số mấy đang cầm bóng, nhưng ít nhất, bạn biết quả bóng đang ở đâu và vẫn phân biệt được màu áo của hai đội.
Còn ở góc quay cận cảnh, hóa ra tín hiệu thực sự không quá tệ. Bạn có thể nhìn thấy cỏ trên sân, logo trên trái bóng, thậm chí cả biểu cảm khuôn mặt của cầu thủ.
Các cỗ máy fMRI ở thời điểm hiện tại cũng vậy. Với độ phân giải 1 voxel, chúng vẫn có thể giúp chúng ta đoán được phần nào suy nghĩ của người nằm trong đó. Chẳng hạn, khi Just tập trung mô hình của mình vào một số "cảnh quay cận", ông có thể sử dụng tín hiệu fMRI để đoán ra cảm xúc của một người đang nằm trong cỗ máy.
Trong thử nghiệm với một tình nguyện viên nữ, ảnh chụp fMRI đã giúp Just đoán chính xác được cảm giác "ghê tởm" của cô ấy. Khi ông hỏi nữ tình nguyện viên đã tưởng tượng ra điều gì trong lúc nằm trong máy cộng hưởng từ, cô ấy trả lời: "Tôi đã nghĩ đến cảnh một ai đó nôn vào người tôi, khi tôi đang xem một trận bóng chày".
Lần thứ hai, mô hình tín hiệu fMRI cho thấy cô ấy đang cảm thấy "ghen tị". Tình nguyện viên sau đó thừa nhận cô vừa tưởng tượng ra hình ảnh của một siêu mẫu.
Không chỉ dừng lại ở đó, các nghiên cứu tiếp theo của Just còn cho thấy ông có thể dựa vào tín hiệu fMRI để chẩn đoán bệnh tự kỷ với độ chính xác lên tới 97%, dựa trên thực tế rằng suy nghĩ của họ rất khác với người bình thường.
Sau đó, mô hình của Just cũng có thể dự đoán được những bệnh nhân trầm cảm có ý định tự tử, độ chính xác lên tới 94% khi phân biệt những người có ý định thoáng qua với những người thực sự đã cố gắng tự tử.
Đến đây, bạn có thể thấy fMRI đang giúp chúng ta làm được những bài trắc nghiệm đọc suy nghĩ. Chỉ cần chúng ta có sẵn các lựa chọn, giữa A và B, giữa người tự kỷ và bình thường, giữa 240 lá thăm bất kỳ, các nhà khoa học có thể đọc vị được bạn giữa đống suy nghĩ đó.
Nhưng còn một bài kiểm tra mang tính tự luận? Chúng ta đang cách một cỗ máy đọc trực tiếp được từng câu, từng chữ trong suy nghĩ của mình bao xa? Một cỗ máy đúng như Julius Emmner mô tả vào năm 1890, thứ có thể dịch bất kỳ suy nghĩ vô hình nào trong đầu thành văn bản?
Có lẽ, câu trả lời là không quá xa. 120 năm sau những dự đoán của Julius Emmner, chúng ta đang ở một điểm ngọt (Sweet-point) của công nghệ. Trong khi máy cộng hưởng từ chức năng, các con chip cấy thẳng vào não bộ và giao diện não-máy tính vẫn đang làm tốt phần việc, có thêm một công nghệ nữa đã tham gia vào quá trình đọc suy nghĩ: Những thuật toán trí tuệ nhân tạo (AI).
Trong một nghiên cứu mới công bố vào tháng 5 trên tạp chí Nature Neuroscience, một nhóm các nhà khoa học đến từ Đại học Texas cho biết khi họ sử dụng AI, trí tuệ nhân tạo này đã có khả năng dịch trực tiếp tín hiệu fMRI thu được từ não bộ của tình nguyện viên thành văn bản với độ chính xác cao về mặt ngữ nghĩa.
Thí nghiệm được thực hiện trên 3 tình nguyện viên diễn ra như sau:
Đầu tiên, họ được mời nằm vào một cỗ máy cộng hưởng từ chức năng fMRI. Các nhà khoa học sau đó bật cho tình nguyện viên nghe các chương trình phát thanh dạng podcast bằng Tiếng Anh như The Moth Radio Hour, The Modern Love Podcast, và TED Radio Hour.
Chia làm nhiều ngày, mỗi tình nguyện viên đã được nghe tổng cộng 16 tiếng podcast. Trung bình, mỗi một phút podcast chứa khoảng 150 từ, vì vậy, họ đã nạp vào đầu mình một chuỗi âm thanh đại diện cho 144.000 từ.
Trong suốt quá trình đó, máy cộng hưởng từ chức năng fMRI đã thu nhận tín hiệu não của họ. Cỗ máy tạo ra các bản quét não sau mỗi khoảng thời gian từ 10-15 giây. Vì vậy, mỗi bản quét này đang chứa đựng trong đó một câu nói với độ dài hơn 30 từ.
Bởi đây là giới hạn về độ phân giải thời gian của fMRI, công việc tiếp theo của các nhà khoa học là phải tìm ra cách để "đọc" được 30 từ vựng trong mỗi tấm ảnh quét não fMRI.
Để làm được điều này, nhóm nghiên cứu dẫn đầu bởi nhà khoa học máy tính Alexander Huth và Jerry Tang đến từ Đại học Texas đã huấn luyện một mô hình ngôn ngữ lớn (LLM). Đây chính là nền tảng AI đứng đằng sau sự thành công của các công cụ như Chat GPT của Open AI.
Mô hình ngôn ngữ lớn có một kỹ thuật gọi là tìm kiếm theo chùm phổ biến. Về cơ bản, kỹ thuật này có khả năng chọn ra các chuỗi từ tốt nhất, cũng như xem xét xác suất kết hợp của tất cả các từ xuất hiện trước mỗi cụm từ.
Sử dụng LLM, nhóm của Huth sau đó đã có thể khớp ảnh chụp fMRI với các nhóm từ và cụm từ trong chương trình podcast tình nguyện viên đã nghe. Bước tiếp theo là kiểm tra xem AI có thể dịch ngược lại tín hiệu từ ảnh fMRI ra văn bản được hay không?
Huth đã cho các tình nguyện viên nghe những bản podcast mới nằm bên ngoài nội dung được đào tạo. Kết quả, AI đã có thể tường thuật lại âm thanh mà tình nguyện viên đã nghe thành văn bản trong thời gian thực.
Chẳng hạn, khi tình nguyện viên nghe một đoạn podcast, trong đó nhân vật được phỏng vấn nói: "Tôi chưa có bằng lái xe", AI đã được giải mã câu nói này từ góc nhìn của người nghe. Ảnh fMRI đại diện cho suy nghĩ của họ được dịch thành cụm: "Cô ấy thậm chí còn chưa bắt đầu học lái xe".
Mặc dù các bản tường thuật này không đúng 100% về mặt từ vựng, chúng có độ chính xác về mặt ngữ nghĩa rất cao:
Không chỉ dừng lại ở đó, trong bước tiếp theo của thử nghiệm, Huth đã yêu cầu các tình nguyện viên tự tưởng tượng ra một câu chuyện trong đầu mình. Mô hình AI mà anh huấn luyện sau đó sẽ đọc ảnh cộng hưởng từ chức năng fMRI để tiếp tục đoán ra ý nghĩa câu chuyện mà tình nguyện viên đã tưởng tượng.
Ví dụ, dưới đây là suy đoán của AI khi nó đọc suy nghĩ của một tình nguyện viên qua ảnh chụp fMRI: "Tôi nghĩ cô ấy sẽ gặp tôi và nói rằng cô ấy nhớ tôi". Bạn có thể so sánh độ chính xác của nó với ý nghĩ mà tình nguyện viên đã báo cáo: "Tôi mong chờ tin nhắn của vợ tôi, nói rằng cô ấy đã đổi ý và muốn được quay lại".
Cuối cùng, mô hình AI của Huth nhận được một thử thách thật sự. Nó được yêu cầu đọc suy nghĩ của một tình nguyện viên trong khi người này đang xem một bộ phim hoạt hình không tiếng.
Suy nghĩ, hay nhận thức của tình nguyện viên về bộ phim này đã được AI đọc ra trong thời gian thực. Dưới đây là kết quả mà bạn có thể thấy, một khi tình nguyện viên xem đoạn phim Sintel, kể về một cô gái chăm sóc một chú rồng con:
kI_sPjORt90-1684920279031259785540
Với mô hình của Huth, chúng ta có thể mạnh dạn tuyên bố rằng: Đúng vậy, những cỗ máy đọc suy nghĩ đã ở đây – sau 120 năm chúng ta ước mơ có được chúng. Nhưng vậy thì sao? Điều gì sẽ xảy ra tiếp theo?
Jerry Tang, đồng tác giả của nghiên cứu mới trên tạp chí Nature Neuroscience cho biết:
"Mục tiêu của bộ giải mã ngôn ngữ mà chúng tôi phát triển là ghi lại hoạt động não bộ của người dùng và dự đoán những từ mà người dùng đang nghe, nói hoặc tưởng tượng. Cuối cùng, chúng tôi hy vọng rằng công nghệ này có thể giúp những người mất khả năng giao tiếp do chấn thương, như bệnh nhân đột quỵ hoặc bệnh ALS, nói chuyện được trở lại".
Nếu vậy, những cỗ máy đọc suy nghĩ sẽ điền một kết thúc có hậu vào mọi câu chuyện mà chúng ta đã nhắc tới:
Jean-Dominique Bauby, vị tổng biên tập của tạp chí Elle, sẽ thoát được khỏi quả chuông lặn. Ông ấy có thể tiếp tục sự nghiệp báo chí và văn chương của mình, đồng thời hoàn thành lời hứa với cậu con trai 9 tuổi.
Họ có thể tới nhà hát để xem vở kịch của Philippe Arias, sau đó cả hai sẽ tới nhà hàng trên đại lộ Place Clichy để thưởng thức món hàu.
Trên thực tế, khi giao diện não máy tính (BCI) giúp bệnh nhân người Đức, người bị nhốt hồn đầu tiên trên thế giới nói được trở lại vào năm 2020, anh ấy đã xin các bác sĩ cho mình uống một cốc bia – dù không cử động được lưỡi, vị giác của bệnh nhân bị nhốt hồn vẫn còn nguyên vẹn.
Vậy là sau 4 năm nằm liệt, cuối cùng bệnh nhân này cũng có thể thưởng thức lại vị của thứ đồ uống truyền thống của những người đàn ông Đức. Giống với Bauby, người đàn ông cũng có một cậu con trai nhỏ, và một trong những điều đầu tiên bệnh nhân này nói với cậu bé sau khi thoát khỏi quả chuông lặn là: "Ba yêu con, trông con ngầu thật. Con có muốn cùng ba xem bộ phim Robin Hood của Disney không?".
Cả hai sau đó đã xem tập phim ấy cùng nhau.
Đối với Bệnh nhân 23 của Martin Monti, câu hỏi trọng tâm dành cho anh ấy vẫn là: Liệu ở trong trạng thái sống thực vật và bị nhốt hồn, anh có muốn chết để được giải thoát hay không?
Các khảo sát trên những người bị nhốt trong cho thấy có khoảng 13-33% bệnh nhân cảm thấy chán nản với tình trạng của mình. Một nghiên cứu năm 2011 sau đó chỉ ra con số 7% bệnh nhân mong muốn được rút ống thở để chết nhân đạo.
Tuy nhiên, ở phía còn lại của quang phổ, có tới 50-67% số bệnh nhân cho rằng họ vẫn cảm thấy hạnh phúc trong tình trạng bị nhốt trong. Đáp lại câu hỏi: "Liệu bạn có muốn tiếp tục sống không?", ¾ bệnh nhân đã trả lời "Có".
Vì vậy, trong một tương lai mà ở đó các cỗ máy đọc suy nghĩ có thể giúp bệnh nhân bị nhốt trong giao tiếp, chắc chắn chất lượng cuộc sống của họ sẽ được cải thiện.
Điều này là cực kỳ quan trọng, bởi các thống kê cho thấy tỷ lệ sống trên 10 năm của các bệnh nhân này có thể lên tới 83%. Có 40% bệnh nhân bị khóa trong thậm chí vẫn sống 20 năm sau cơn bạo bệnh.
Một cỗ máy đọc suy nghĩ sẽ biến 20 năm cuộc đời đó của họ trở nên sinh động, hòa đồng và ngập tràn hạnh phúc – thay vì không thể giao tiếp và bị cầm tù trong chính thể xác của mình, đắm chìm trong những suy nghĩ độc thoại dưới bóng tối của quả chuông lặn.
Còn về phần Johnny Ray, cựu chiến binh Mỹ 53 tuổi, người đã phải mất 9 tháng với hai điện cực cấy vào đầu để có thể viết được tên mình trên màn hình, bây giờ, ông có thể làm điều đó trong vài ngày với một cỗ máy đọc suy nghĩ, vài tuần đào tạo để có thể nói bất cứ điều gì.
BRAVO-1 và T5, những bệnh nhân đang giữ kỷ lục giao tiếp bằng suy nghĩ thông qua giao diện BCI cũng sẽ có thêm một lựa chọn nữa, sử dụng thiết bị đọc suy nghĩ không xâm lấn thay vì những con chip cấy thẳng vào não bộ.
Sự thật là không phải ai cũng sẵn sàng chịu đựng rủi ro về một cuộc phẫu thuật thần kinh, đưa những thiết bị điện tử vào bên trong hộp sọ của mình chỉ để có thể gõ văn bản bằng những câu lệnh nhàm chán.
Do đó, công nghệ giải mã suy nghĩ từ ảnh quét não sẽ làm giảm chi phí cơ hội, mở rộng phạm vi tiếp cận và cho phép ngay cả một người bình thường cũng có thể sử dụng chúng.
Nhưng cũng chính tại đây, một mối lo ngại về mặt đạo đức đã nổi lên. Câu hỏi là: Ai sẽ có thể, và có quyền sử dụng công nghệ này?
Các chính phủ, trong một số trường hợp nghĩ rằng họ nên được phép sử dụng nó. Chẳng hạn, khi một điều tra viên thẩm vấn tội phạm, một thẩm phán hỏi cung bị can, hoặc một luật sư lấy lời khai nhân chứng, họ có thể dùng một máy quét fMRI để biết ai đang nói dối và ai đang nói thật.
Các nhà quảng cáo, trong một lĩnh vực hoàn toàn mới gọi là "tiếp thị thần kinh" (neuromarketing), cũng đang cố gắng khai thác suy nghĩ của khách hàng một cách trực tiếp từ não bộ.
Họ chưa đến nỗi ngang nhiên chèn một clip quảng cáo tưởng tượng vào não của những bệnh nhân cần chụp cộng hưởng từ trong bệnh viện. Nhưng tại thời điểm này, trên thị trường đã bắt đầu xuất hiện những tựa game mà bạn có thể chơi chúng trực tiếp từ suy nghĩ của mình, thông qua những chiếc mũ thu nhận tín hiệu điện não đồ.
Trong tương lai, nếu công nghệ chụp cộng hưởng từ chức năng fMRI có thể được thu nhỏ và giảm chi phí, sẽ không quá ngạc nhiên khi chúng ta sẽ có những điểm truy cập thần kinh công cộng, nơi bạn có thể nằm vào một máy fMRI để đi tới một thế giới ảo dạng metaverse bằng nhân vật avatar của chính mình, một cơ thể ảo mà bạn có thể điều khiến nó bằng chính suy nghĩ.
Những điểm truy cập này chắc chắn sẽ làm mưa làm gió thị trường giống như những quán game online từng thực hiện được vào đầu thế kỷ 21. Điều này khiến một số nhà đạo đức khoa học công nghệ lo ngại rằng đó có thể là khởi đầu cho một giai đoạn gọi là "chủ nghĩa tư bản thần kinh".
Ở đó, suy nghĩ của bạn có thể trở thành một mặt hàng như dữ liệu cá nhân của bạn ở thời điểm này. Và sẽ không chỉ có các nhà quảng cáo muốn khai thác dữ liệu thần kinh của bạn. Ngay cả các ông chủ cũng muốn làm điều đó.
Người sử dụng lao động nào mà không muốn biết nhân viên của mình có tập trung làm việc hay không, ai là những người thực sự trung thành với mình còn ai là những người hay nói xấy sau lưng sếp?
Vì vậy, nếu một ngày bạn thấy trong văn phòng của mình xuất hiện một chiếc máy cộng hưởng từ chức năng, bạn biết rằng bóng dáng của chủ nghĩa tư bản thần kinh đã tới.
Trong thời đại này, không chỉ có sức lao động, thông tin cá nhân hay dữ liệu người dùng của bạn bị khai thác, ngay cả những suy nghĩ trong đầu bạn cũng có thể bị biến thành một loại hàng hóa hay tài sản.
Những cỗ máy đọc suy nghĩ có mặt ở đây như một công cụ sản xuất mới, một phương tiện tiếp thị, thậm chí một cỗ máy có khả năng theo dõi, giám sát và định hướng xã hội. Nó khiến chúng ta giật mình nhận ra rằng, có một câu hỏi xuyên thời đại đã ở đó gần 120 năm, trên tiêu đề của một bài báo được xuất bản bởi Seattle Star năm 1908.
Đó là những năm cuối cùng của cuộc cách mạng công nghiệp lần thứ hai và các nhà sáng chế như Julius Emmner tự tin nghĩ rằng họ sẽ sớm tạo ra được một cỗ máy đọc suy nghĩ. Nhưng rồi sau đó thì sao: "Liệu bạn đang có bí mật nào không? Nếu có hãy cảnh giác với những cỗ máy đọc suy nghĩ".
Tổng hợp