TỔNG QUAN VỀ ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG HÓA HỌC

1. GIỚI THIỆU CHUNG

Trên thế giới, trí tuệ nhân tạo (AI) được bắt đầu ứng dụng vào lĩnh vực hóa học từ những năm 1980, qua những nghiên cứu như “Ứng dụng AI trong hóa học” [1], hoặc trong cuốn sách “AI trong kỹ thuật hóa học” [2]…

Ở Việt Nam chưa có công trình nghiên cứu nào về áp dụng AI vào lĩnh vực hóa học. Bài báo này sẽ bước đầu nghiên cứu tổng quan về vấn đề trên, trong đó sơ lược lại những công trình đã được công bố trên thế giới, tóm tắt lại những thành tựu và những vấn đề còn tồn đọng trong việc áp dụng AI vào hóa học.

2. AI ỨNG DỤNG TRONG MỘT SỐ CHUYÊN NGÀNH HÓA HỌC

2.1. Hóa vô cơ

Năm 1986, nghiên cứu [1] giới thiệu một chương trình máy tính có tên GEORGE được dùng để giải các bài toán hóa học cơ bản dựa trên mối quan hệ giữa số mol, khối lượng và thể tích. Đây có thể coi là bước đầu tiên áp dụng AI vào lĩnh vực vô cơ.

Gần đây, năm 2018, tác giả Kevin Ryan và cộng sự đã sử dụng một mạng thần kinh sâu (tương tự kiểu AI học máy và AI trên các xe tự hành) để tự nó tìm ra các quy luật hóa học từ sự sắp xếp các nguyên tử trong hơn 50.000 cấu trúc tinh thể vô cơ, đồng thời không cung cấp cho nó bất kỳ kiến thức nào về hóa học [3]. Kết quả thử nghiệm cho thấy mạng thần kinh trên đã nhận ra được sự tương đồng về tính chất của các nguyên tố trong cùng một nhóm (trong bảng hệ thống tuần hoàn), và đề xuất một số hợp chất mới với mô tả các tính chất cụ thể.

2.2. Hóa hữu cơ

David W. Elrod năm 1990 với bài báo [4] đã sử dụng mạng thần kinh truyền lại (huấn luyện bằng ma trận BE-Dugundji-Ugi cải tiến) để dự đoán hóa trị trong các sản phẩm các phản ứng hữu cơ. Kết quả là mạng thần kinh trên đã dự đoán chính xác về hóa trị của sản phẩm một số loại phản ứng: phản ứng Markovnikov đối với anken, phản ứng Diels-Alder, phản ứng retro-Diels-Alder, và phản ứng Saytzeff loại trừ. Đồng thời, mạng thần kinh có thể tự đưa ra thông tin phản ứng từ các phản ứng mẫu được huấn luyện mà không cần các quy luật phản ứng.

Gần đây, vào năm 2017, các nhà nghiên cứu của IBM đã phát triển một chương trình AI (được thiết kế dựa trên hệ thống dịch ngôn ngữ mới nhất, tương tự hệ thống mạng thần kinh nhân tạo của Google) để dự đoán các sản phẩm của phản ứng hữu cơ [5]. Trong đó, các cấu trúc hóa học được mã hóa thành một chuỗi các chữ cái và số. Sau đó AI xem xét các phản ứng hóa học tương tự như việc dịch thuật. Kết quả cho thấy chương trình AI này đã chọn đúng hơn 80% sản phẩm của phản ứng hữu cơ, mặc dù nó không được dạy bất kỳ quy tắc hóa hữu cơ nào.
 
 
 
2.3. Hóa phân tích

AI trong lĩnh vực hóa phân tích được bắt đầu khá sớm, khởi đầu từ công trình của Z.Hippe năm 1983 [6]. Trong đó, giới thiệu các ứng dụng của AI trong hóa phân tích, đưa ra cách tiếp cận dựa trên các phương pháp tìm kiếm giảm vấn đề, thuật toán và heuristic. Nghiên cứu cũng đề xuất khả năng phát triển trong tương lai của việc sử dụng AI trong hóa phân tích.

2.4. Hóa lý

Năm 1993, Geerd Diercksen đã kết hợp hóa lượng tử, mạng thần kinh, và tính toán tượng trưng và tính toán số để xây dựng một “phần mềm thông minh” OpenMol ứng dụng trong lĩnh vực tính toán hóa lý phân tử [7].

2.5. Hóa sinh

Năm 2002, tác giả Catholijn M. Jonker và cộng sự đã sử dụng chương trình AI (viết bằng Prolog) ứng dụng trong hóa sinh, sau quá trình huấn luyện, chương trình có thể tự mô tả chính xác các đặc tính cơ bản của tế bào. Các minh chứng đã thể hiện rõ trong các hiện tượng thí nghiệm về sự ức chế dị hóa và hiện tượng cảm ứng cơ chất ở vi khuẩn Escherichia coli [8].

Năm 2013, tác giả Jan Urban và cộng sự sau quá trình nghiên cứu đã kết luận rằng bên cạnh những thuận lợi nhất định do AI mang lại trong lĩnh vực hóa sinh, thì bản thân lĩnh vực này cần có sự hợp tác liên ngành với nhiều lĩnh vực khác thì sẽ phát huy tác dụng của AI mạnh hơn [9].

2.6. Hóa dược

Năm 2018, Daniel Merk và cộng sự đã huấn luyện một mạng thần kinh hồi quy để nó nắm được một cách có hệ thống cấu tạo các hợp chất có hoạt tính sinh học (dựa trên hệ thống phân tử đầu vào đơn giản hóa, SMILES). Kết quả là mạng thần kinh đã có thể nhận ra được các hợp chất retinoid-X và các chất chủ vận thụ thể dạng kích hoạt, đồng thời nó cũng đề xuất các hợp chất mới với các dược tính cụ thể. Như vậy, mạng thần kinh đã nắm bắt được các kiến ​​thức hóa học và sinh học có liên quan, mà không cần được huấn luyện các quy luật cụ thể.

Các nghiên cứu khác về AI trong lĩnh vực hóa dược cũng chủ yếu tập trung vào ứng dụng mô hình học tập sâu để thiết kế các loại thuốc mới với các dược tính mong muốn.

3. ĐẶC ĐIỂM CỦA AI TRONG HÓA HỌC

3.1. Sự phân loại AI

AI hiện nay được chia thành ba trường phái chính: AI truyền thống, AI tính toán, và hệ thống thông minh lai.

AI truyền thống (còn được biết với các tên AI biểu tượng, AI logic, AI ngăn nắp, AI cổ điển) bao gồm các phương pháp: học máy (machine learning), hệ hình thức (formalism), phân tích thống kê, hệ chuyên gia (expert systems), lập luận theo tình huống, lập luận và suy diễn tự động, mạng Bayes, xử lý ngôn ngữ tự nhiên (chữ viết, dịch, tìm kiếm), xử lý giọng nói (nghe, đọc), xử lý hình ảnh (nhận diện ảnh), lập và tối ưu kế hoạch, robotics…

AI tính toán tập trung vào nghiên cứu việc học hoặc phát triển lặp, ví dụ như tinh chỉnh tham số trong hệ thống. AI tính toán có quan hệ mật thiết với các kiểu AI phi ký hiệu, AI lộn xộn (scruffy AI) và tính toán mềm. Các phương pháp chính trong AI tính toán gồm có: mạng thần kinh (neural network), hệ mờ (fuzzy system), tính toán tiến hóa (evolutionary computation), AI hành vi (behavior based AI).

Hệ thống thông minh lai là một dạng AI trong đó kết hợp hai trường phái kể trên, các quy luật suy diễn của hệ chuyên gia có thể được tự tạo ra bởi mạng thần kinh hoặc các quy luật hệ quả từ việc học theo thống kê.

3.2. Các quá trình cơ bản của AI hóa học

Trong mỗi chương trình AI luôn phải có 2 quá trình cơ bản là quá trình biểu diễn tri thức và quá trình tìm kiếm tri thức trong miền biểu diễn [10].

Trong các AI hóa  học, tri thức là bộ dữ liệu các phản ứng, ví dụ 10 triệu phản ứng trong nghiên cứu [11], trong đó chứa các thông tin chi tiết về điều kiện phản ứng, cấu trúc và tính chất lý-hóa-sinh của các chất tham gia và sản phẩm phản ứng. Các thông tin trên được lựa chọn (phù hợp với mục đích xây dựng AI) và biểu diễn thành miền tri thức của bài toán. Để biểu diễn tri thức của bài toán người ta thường sử dụng các phương pháp như: phương pháp biểu diễn nhờ luật, phương pháp biểu diễn nhờ mạng ngữ nghĩa, phương pháp biểu diễn nhờ Frame, phương pháp biểu diễn nhờ logic vị từ.

Kỹ thuật quan trọng để giải bài toán trong lĩnh vực AI là sử dụng các phương pháp tìm kiếm trong miền tri thức đặc trưng cho bài toán đó. Các chiến thuật tìm kiếm thường dùng là tìm kiếm suy diễn tiến, tìm kiếm suy diễn lùi. Công cụ để thực hiện các chiến thuật tìm kiếm chính là các giải thuật tìm kiếm, có thể kể đến như: giải thuật tìm kiếm theo chiều rộng, giải thuật tìm kiếm theo chiều sâu, giải thuật tìm kiếm truyền lùi, giải thuật tìm kiếm Heuristic…

3.3. Một số AI phổ biến trong hóa học

Cho tới những năm 1990, đã có hàng loạt AI ứng dụng trong hóa học đã được đề cập đến [12], như SHRDLU, Script Applier Mechanism, STRIPS, ARSTRIPS… các chương trình thời kỳ đầu này đều dùng dạng AI yếu (AI hẹp) để đáp ứng cho một nhiệm vụ cụ thể trong hóa học. Thời gian sau, AI hệ chuyên gia được sử dụng để xây dựng các phần mềm như MYCIN, XCON, MECHEM… dùng để phân loại các chất với mục tiêu cụ thể, hoặc lấy các dữ liệu đáp ứng một đặc trưng nào đó theo các quy tắc đã được thiết kế trước. Gần đây, khi kỹ thuật tìm kiếm trạng thái không gian heuristic được ứng dụng vào AI, một loạt các phần mềm AI mới ra đời như: SYNCHEM, CASE, CHEMICS, DENDRAL, SEAC, STREC, SECS…

Hiện nay, các công bố chủ yếu giới thiệu các thuật toán AI phát triển riêng hoặc các mạng thần kinh sử dụng AI riêng. Ví dụ năm 2018, nghiên cứu “Ứng dụng học máy để dự đoán các điều kiện phù hợp cho phản ứng hữu cơ” đã ứng dụng Thuật toán nhúng phân phối Stochastic Neighbor (t-SNE) [11],  hoặc nghiên cứu “Ứng dụng mô hình mạng thần kinh tích chập biểu đồ để dự đoán hoạt tính hóa học” sử dụng Mạng thần kinh Weisfeiler-Lehman [13]…

3.4. Những vấn đề cần được giải quyết

Một số nhược điểm của các AI hiện nay là: các AI chưa tự sinh ra được heuristic, AI chưa có một số khả năng như con người (xử lý song song các hành vi, diễn giải một vấn đề theo nhiều phương pháp khác nhau, xử lý thông tin trong môi trường liên tục, học như loài người, tự thích nghi với môi trường) [14].

4. KẾT LUẬN

Các chương trình AI trong lĩnh vực hóa học hầu như tập trung chủ yếu vào việc thiết kế các phân tử mới từ kho dữ liệu khổng lồ các hợp chất hóa học đã biết, nhằm tìm ra hợp chất đáp ứng một yêu cầu cụ thể về tính chất lý-hóa-sinh-dược. Cũng có các AI được thiết kế tập trung vào dự đoán điều kiện phản ứng, từ đó giảm bớt hàng triệu các thí nghiệm kiểm chứng, nhằm tập trung vào các thí nghiệm mà AI đã dự đoán có sản phẩm phù hợp nhất.

Tuy là các phần mềm AI ứng dụng trong hóa học, nhưng hầu hết chúng đều được viết bởi các kỹ sư, nhà thiết kế phần mềm làm việc trong lĩnh vực tin học hoặc công nghệ thông tin. Hầu như chưa có chương trình AI ứng dụng trong hóa học nào mà được viết bởi chính các nhà hóa học, điều đó phần nào cho thấy để thiết kế và ứng dụng được AI vào hóa học là một công việc phức tạp, cần lượng lớn thông tin về hóa học và cần chuyên môn rất sâu về công nghệ tin học.

 

TÀI LIỆU THAM KHẢO

[1]

Thomas H. Pierce, Bruce A. Hohne, Artificial Intelligence Applications in Chemistry (ACS Symposium Series), 1st edition, Washington, DC: American Chemical Society, 1986.

[2]

Thomas E. Quantrille, Y.A. Liu, Artificial Intelligence in Chemical Engineering, Elsevier Inc.: Academic Press, 1992.

[3]

Kevin Ryan, Jeff Lengyel, and Michael Shatruk, "Crystal Structure Prediction via Deep Learning," Journal of the American Chemical Society, vol. 140, no. 32, pp. 10158-10168, 2018.

[4]

David W.Elrod, Gerald M.Maggiora, Robert G.Trenary, "Applications for neural networks in chemistry. 2. A general connectivity representation for the prediction of regiochemistry," Tetrahedron Computer Methodology, vol. 3, no. 3-4, pp. 163-174, 1990.

[5]

P. Schwaller, et al..., "Proceedings of the 31st Conference on Neural Information Processing Systems," in Conference on Neural Information Processing Systems, Long Beach, 2017.

[6]

Z.Hippe, "Problems in the application of artificial intelligence in analytical chemistry," Analytica Chimica Acta, vol. 150, pp. 11-21, 1983.

[7]

F.J.Smith, M.Sullivan, J.Collis, S.Loughlin, "Applying Artificial Intelligence in Physical Chemistry," Advances in Quantum Chemistry, vol. 28, pp. 319-328, 1997.

[8]

Catholijn M. Jonker, Jacky L. Snoep, Jan Treur, Hans V. Westerhoff, "Putting Intentions into Cell Biochemistry - An Artificial Intelligence Perspective," Journal of Theoretical Biology, vol. 214, no. 1, pp. 105-134, 2002.

[9]

Jan Urban, Petr Císař, Aliaksandr Pautsina, Jindřich Soukup, Antonín Bárta, "Artificial Intelligence In Biology," in Technical Computing Prague, Prague, 2013.

[10]

Nguyễn Thiện Thành, Trí tuệ nhân tạo và hệ chuyên gia, TP HCM: Trường Đại học Bách khoa, Đại học Quốc gia TPHCM, 2006.

[11]

Hanyu Gao, Thomas J. Struble, Connor W. Coley, Yuran Wang, William H. Green, Klavs F. Jensen, "Using Machine Learning To Predict Suitable Conditions for Organic Reactions," ACS Cental Science, vol. 4, no. 11, pp. 1465-1476, 2018.

[12]

N.A.B. Gray, "Artificial intelligence in chemistry," Analytica Chimica Acta, vol. 210, pp. 9-32, 1988.

[13]

Connor W. Coley, Wengong Jin, Luke Rogers, Timothy F. Jamison, Tommi S. Jaakkola, William H. Green, Regina Barzilay, Klavs F. Jensen, "A graph-convolutional neural network model for the prediction of chemical reactivity," Chemical Science, vol. 10, pp. 370-377, 2018.

[14]

Ngô Hữu Phúc, Nhập môn Trí tuệ nhân tạo, Hà Nội: Học viện Kỹ thuật Quân sự, 2011.

 Lê Minh Thành - Khoa Hóa và Môi trường, Trường Đại học Thủy lợi