Hướng phát triển đúng đắn Hệ thống tính toán hiệu năng cao phục vụ nhu cầu tính toán khoa học chuyên ngành tại Viện Hàn lâm KHCNVN

Ngày nay, việc sử dụng máy tính hiệu năng cao trong các ngành khoa học và kỹ thuật đã và đang thay đổi cơ bản tiến trình nghiên cứu khoa học. Các ngành khoa học cơ bản trước đây dần đã chuyển đổi với thành phần không thể thiếu là “tính toán” như “sinh học tính toán”, “hoá học tính toán”, “vật lý tính toán”, “vật liệu tính toán”, “cơ học tính toán”, “địa vật lý tính toán”,... Các ngành khoa học này có điểm chung là xử lý thông tin, phân tích và dự báo kết quả bằng tính toán, mô phỏng sử dụng nền tảng tính toán hiệu năng cao. Trong thời đại CMCN 4.0, các trung tâm tính toán hiệu năng cao cũng là hạ tầng số để triển khai các nền tảng xử lý dữ liệu lớn (big data), trí tuệ nhân tạo (AI) ứng dụng trong công nghiệp.

 

hncao1

 Nắm bắt định hướng phát triển chung nêu trên, ngay từ những năm đầu của thập kỷ trước, Trung tâm Tin học trực thuộc Viện Hàn lâm KHCNVN (sau này đổi tên thành Trung tâm Tin học và Tính toán – viết tắt là TTTHTT) đã đề xuất dự án đầu tư xây dựng một Trung tâm tính toán hiệu năng cao dùng chung cho các Viện nghiên cứu thuộc Viện Hàn lâm KHCNVN và chia sẻ tài nguyên tính toán với cộng đồng nghiên cứu khoa học công nghệ nói chung trong cả nước. Ngày 3/7/2012 Chủ tịch Viện Hàn lâm KHCNVN ra quyết định số 873/QĐ-KHCNVN giao cho TTTHTT thực hiện Dự án "Đầu tư xây dựng hệ thống tính toán và trang thiết bị phục vụ đào tạo nhân lực tính toán khoa học tại Viện Hàn lâm Khoa học và Công nghệ Việt Nam". Với ngân sách rất khiêm tốn so với các dự án xây dựng hệ thống tính toán hiệu năng cao khác được thực hiện cùng thời gian đó, một hệ thống được đưa vào vận hành phục vụ cho các nghiên cứu khoa học trong toàn Viện Hàn lâm, bao gồm 24 máy chủ kết nối song song qua mạng InfiniBand tốc độ cao, được chia thành 3 bó:

1. Bó điện toán đám mây (OpenStack) với 1 nút điều khiển và 5 nút tính toán;

2. Bó tính toán CPU (Rocks) với 1 nút điều khiển và 13 nút tính toán;
3. Bó GPU (StackIQ) gồm 1 nút điều khiển khiển và 3 nút tính toán (kết hợp CPU Intel Xeon và GPU Tesla K20m).
Tổng năng lực tính toán của hệ thống lên đến 6 TFlops (nghìn tỷ thao tác dấu phẩy động mỗi giây).
Điểm khác biệt của chiến lược phát triển hệ thống tính toán hiệu năng cao đề xuất bởi TTTHTT là chỉ đầu tư phần cứng hạ tầng tính toán hiệu năng cao đáp ứng đúng nhu cầu người sử dụng, tránh lãng phí ngân sách, dành một phần kinh phí đáng kể của dự án để hỗ trợ, khuyến khích việc phát triển các đề tài tính toán khoa học cho các đơn vị nghiên cứu chuyên ngành trực thuộc Viện HLKHCNVN. Song hành với dự án xây dựng hệ thống tính toán nêu trên, Lãnh đạo Viện HLKHCNVN cũng đã phê duyệt thực hiện đề tài độc lập cấp Viện: "Phát triển tính toán khoa học chuyên ngành trên cơ sở máy tính hiệu năng cao chia sẻ tài nguyên tại Viện Hàn lâm KHCNVN giai đoạn 1”, đề tài thực hiện trong 3 năm từ 2013 – 2015 do Trung tâm Tin học và Tính toán chủ trì. Đề tài gồm 6 nhánh độc lập với sự phối hợp của 5 đơn vị là Trung tâm Tin học và Tính toán, Viện Công nghệ thông tin, Viện Vật lý, Viện Khoa học vật liệu và Viện Nghiên cứu hệ gen. Thành công của đề tài ở giai đoạn 1 đã góp phần quảng bá, lôi cuốn nhiều đơn vị, cá nhân nghiên cứu khoa học tham gia sử dụng hệ thống tính toán hiệu năng cao trong ứng dụng nghiên cứu khoa học chuyên ngành. Đề tài đã được nghiệm thu “xuất sắc” với kết quả cụ thể là: 16 vấn đề tính toán khoa học được thực hiện và đã công bố 15 bài báo trong các tạp chí khoa học uy tín quốc tế, trong đó có 04 bài báo thuộc danh mục SCIE, 01 bài báo thuộc ESCI, 03 bài báo thuộc Scopus, 03 báo cáo khoa học tại hội thảo quốc tế và 04 bài báo trên tạp chí/hội thảo quốc gia.

Cùng với sự phát triển về nhu cầu tính toán hiệu năng cao của các viện nghiên cứu chuyên ngành và các nhà khoa học trong nước (được sử dụng miễn phí hạ tầng của TTTHTT), Hệ thống tính toán hiệu năng cao của Viện HLKHCNVN được liên tục nâng cấp, bổ sung năng lực tính toán. Cho đến nay, Hệ thống đã có thêm các bó tính toán:

* 5 nodes CPU có 2 bộ xử lý 14 lõi, tốc độ 2.6GHz, sử dụng bộ nhớ RAM mới nhất DDR4 dung lượng 128GB, tích hợp card Infiniband cho phép truyền dữ liệu tốc độ cao giữa các Node

* 10 nodes GPU: có 2 bộ xử lý 14 lõi, tốc độ 2.6GHz, sử dụng bộ nhớ RAM mới nhất DDR4 dung lượng 128GB, tích hợp card Infiniband cho phép truyền dữ liệu tốc độ cao giữa các Node, tích hợp card xử lý đồ họa NVIDIA Tesla P100 cho tốc độ tính toán lên tới 18.7 TeraFLOPS
Hệ thống luôn được đăng ký gần như toàn tải tính toán từ các người dùng ở các viện nghiên cứu chuyên ngành khác nhau.

Tiếp tục định hướng thúc đẩy phát triển các hướng tính toán khoa học ở các viện nghiên cứu chuyên ngành, năm 2017 Lãnh đạo Viện HLKHCNVN đã phê duyệt đề tài: “Phát triển nghiên cứu tính toán khoa học chuyên ngành sử dụng máy tính hiệu năng cao tại Viện Hàn lâm KHCNVN giai đoạn 2” thực hiện từ 2017-2019, do PGS.TS. Phạm Hồng Quang – Giám đốc TTTHTT làm chủ nhiệm. Đề tài đã có hàng chục đăng ký nhánh nghiên cứu từ các viện chuyên ngành trực thuộc, do kinh phí có hạn, lãnh đạo Viện HLKHCNVN đã phê duyệt 5 đề xuất từ các đơn vị là Trung tâm Tin học và Tính toán, Viện Vật lý, Viện Khoa học vật liệu, Viện Kỹ thuật nhiệt đới và Viện Vật lý địa cầu.

Mục tiêu của đề tài giai đoạn 2 là thúc đẩy ứng dụng tính toán khoa học vào các nghiên cứu đa ngành sử dụng hệ thống máy tính hiệu năng cao tại Viện Hàn lâm KHCNVN. Khai thác sử dụng hợp lý các nguồn lực để có kết quả nghiên cứu cụ thể với các sản phẩm tập trung theo hai hướng: một là, nghiên cứu cơ bản về tính toán khoa học trong lĩnh vực vật lí, hóa học và ứng dụng trong chế tạo vật liệu mới, các kết quả nghiên cứu đạt đẳng cấp quốc tế và được công bố khoa học trên các tạp chí SCIE; hai là, nghiên cứu phát triển các hệ thống phần mềm ứng dụng chạy trên hệ thống máy tính hiệu năng cao để cung cấp các dịch vụ lưu trữ, xử lý tính toán trên dữ liệu cỡ lớn phục vụ đời sống xã hội.

Ngày 06 tháng 3 vừa qua, Hội đồng nghiệm thu cấp Viện HLKHCNVN đã nhất trí đánh giá “xuất sắc” kết quả nghiên cứu của đề tài, với các kết quả chính như sau:

 04 Phần mềm và bộ số liệu tính toán khoa học;

01 Hệ thống lưu trữ dữ liệu cỡ lớn trên nền tảng điện toán đám mây và hiệu năng cao;
09 bài báo trong các tạp chí quốc tế ISI, ISI-E;
08 bài báo hội nghị trong và ngoài nước;
01 đơn đăng ký sáng chế (đang trong quá trình xem xét đơn);
Hỗ trợ đào tạo 06 nghiên cứu sinh và 02 thạc sỹ.

Các nhánh đề tài đã sử dụng hạ tầng và dịch vụ tính toán hiệu năng cao vận hành bởi TTTHTT để thực hiện các nghiên cứu chuyên ngành sâu, như tính toán mô phỏng vật liệu siêu biến và cấu trúc tinh thể quang tử; sử dụng các mô hình số trị cỡ lớn để xác định vận tốc gió các lớp sát mặt đất ở khu vực đồng bằng nam bộ; mô phỏng quá trình cuốn và thoát của protein mới sinh; tính toán mô hình cơ học thống kê về bám dính của các sinh vật biển gây hư hại vỏ tàu thủy; tính toán mô phỏng lan truyền của các chùm hạt electron và alpha năng lượng thấp qua các lớp vật chất; mô phỏng tính toán cấu trúc vật lý và hóa học của các vỏ sao già; sử dụng tính toán hiệu năng cao để nghiên cứu cấu trúc và tính chất của vật liệu bán dẫn hữu cơ để chế tạo linh kiện OLED; xây dựng hệ thống hạ tầng lưu trữ dữ liệu lớn; lưu trữ và xử lý phân tán trên nền tảng điện toán đám mây. Việc ứng dụng tính toán trên nền tảng máy tính hiệu năng cao đã giúp các nhà khoa học đạt được các kết quả nghiên cứu có chất lượng cao, cụ thể:

Nhánh đề tài do PGS.TS. Ngô Quang Minh – Viện Khoa học Vật liệu làm chủ nhiệm đã tính toán mô phỏng cộng hưởng sóng quang học, cộng hưởng plasmon bề mặt, truyền dẫn sóng quang học trong linh kiện quang tử 2D sử dụng cấu trúc mạng tinh thể quang tử và cấu trúc siêu vật liệu, qua đó đã phân tích, thiết kế và mô phỏng thành công bộ lọc sóng quang học bậc 5 có hệ số phẩm chất Q cao hơn trong vùng sóng thông tin quang; thu được phổ hấp thụ đạt 99,8% trong vùng tần số THz truyền qua một số vật liệu thông dụng như giấy, quần áo ứng dụng trong y học và an ninh quốc phòng.

hncao2
Ảnh: Cấu trúc của bộ lọc quang học bậc 5 (hình chính bên trái), chi tiết của một bộ cộng hưởng (hình phụ bên trái) và kết quả mô phỏng FDTD sự truyền qua của sóng phân TE đối với các bộ lọc khác nhau.

hncao3

Ảnh: Cấu trúc cách tử điện môi phi tuyến được phủ một lớp bạc mỏng với ánh sáng tới chiếu vuông góc với bề mặt cấu trúc (ảnh trái) và kết quả tính toán phổ phản xạ tuyến tính/phân bố trường điện từ (ảnh phải)

Nhánh đề tài do PGS.TS. Vũ Đình Lãm – Viện Khoa học vật liệu làm chủ trì thiết kế và chế tạo thành công mẫu vật liệu siêu biến hóa MMs có cấu trúc nhẫn tròn từ số liệu tính toán mô phỏng sử dụng tính toán hiệu năng cao.

hncao4

Ảnh: Phổ truyền qua của cấu trúc nhẫn tròn bất đối xứng khi tăng từ 0-1 mm, (a) Mô phỏng, (b) Thực nghiệm.

Nhánh đề tài do TS. Phạm Xuân Thành – Viện Vật lý địa cầu làm chủ nhiệm đã cài đặt và hiệu chỉnh tham số mô hình Dự báo và Nghiên cứu khí tượng (WRF- Weather Research and Forecasting) để xác định phân bố vận tốc gió lớp không khí sát đất với đánh giá hiệu chuẩn bằng số liệu đo đạc tại tháp đo gió Bạc Liêu. Bản đồ phân bố tốc độ gió và mật độ năng lượng gió khu vực Đông Nam bộ có thể được sử dụng như một cơ sở khoa học để đánh giá hiệu quả đầu tư các hệ thống phát điện gió ở ven biển miền Nam.

hncao5
Ảnh: Mật độ năng lượng gió (W/m2) tại độ cao 20m, 40m, 100m, và 200mgiai đoạn 2016-2017

Viện Vật lý là đơn vị có số lượng hướng nghiêu cứu, khối lượng, thời gian tính toán/dữ liệu lưu trữ trên nền tảng tính toán hiệu năng cao nhiều nhất. Các mô hình vật lý tính toán được xây dựng, chạy trên hệ thống tính toán dùng chung tạo ra các kết quả có ý nghĩa khoa học cao được công bố như:

Nhóm nghiên cứu chủ trì bởi PGS.TS. Đinh Văn Trung đã sử dụng phương pháp mô phỏng động lực học phân tử dựa trên phương trình Langevin để nghiên cứu ảnh hưởng của đường hầm thoát ribosme lên quá trình cuốn và thoát của protein mới sinh trong môi trường tế bào. Kết quả tính toán mô phỏng tạo cơ sở để tiên đoán về cơ chế cuốn hậu dịch mã của protein khi ta có điều kiện đối chiếu thời gian thoát thu được từ mô phỏng với thời gian thoát thu được bởi thực nghiệm, đồng thời cũng cho thấy trong đường hầm với hình dạng thực dễ xảy ra sự mắc kẹt protein bên trong đường hầm gồm đầy đủ các nguyên tử được lấy từ cấu trúc ribosome thực của vi khuẩn cổ Haloarcula Marismortui lấy từ ngân hàng dữ liệu protein (PDB code: 1JJ2) hơn so với đường hầm hình trụ rỗng. Do vậy, để protein có thể thoát ra một cách hiệu quả, có thể cần có thêm vai trò chủ động của ribosome cũng như của các chaperone liên kết với ribosome.

hncao6
Ảnh: Các kết quả tính toán mô phỏng trên máy tính hiệu năng cao
(a) Mô hình đường hầm thoát ribosome đầy đủ các nguyên tử và một cấu hình protein mới sinh trong đường hầm.
(b) Sự phụ thuộc của thời gian thoát vào hệ số ma sát của môi trường đối với amino acid cho protein GB1 (hình nhúng bên trong). (c) Phân bố thời gian thoát của protein GB1 cho các trường hợp hệ số ma sát g = 1, 3 và 5 m τ-1.

 Nhóm nghiên cứu chủ trì bởi PGS.TS. Trịnh Xuân Hoàng đã phát triển một mô hình lý thuyết mở rộng mô hình SEA (surface energetic attachment - đã được đề xuất trước đây bởi nhóm nghiên cứu của A.B. Brennan tại Đại học Florida) dựa trên cơ học thống kê để dự đoán hành vi bám dính của các sinh vật biển trên bề mặt vi đồ họa. Kết quả nghiên cứu được sử dụng để tạo ra các công nghệ mới thay thế việc sử dụng các hóa chất gây nhiễm độc môi trường nước nhằm ngăn ngừa sự bám dính của các vi sinh vật biển lên các bề mặt vật liệu sử dụng trong ngành hàng hải như vỏ tàu thủy có thể làm hỏng vỏ tàu, làm giảm vận tốc di chuyển, tăng chi phí nhiên liệu, bảo dưỡng, sửa chữa v.v.

hncao7
Ảnh: Một số ví dụ về cấu hình cân bằng của các bào tử bám trên bề mặt vi đồ họa (a-d)
và các hàm phân bố xuyên tâm tương ứng (e-h) thu được từ mô phỏng Monte Carlo
trong mô hình bám dính bề mặt với tương tác hút giữa các bào tử.
Các kết quả được thể hiện cho hệ N = 100 bào tử trên bề mặt Sharklet
với kích thước 4 x 4 ô cơ sở, cho các trường hợp năng lượng tương tác
giữa các bào tử Eint = 0, -1, -2.2 và -3 kT như được chú thích trong hình.

 Nhóm nghiên cứu chủ trì bởi PGS.TS. Lê Hồng Khiêm đã xây dựng phần mềm ELECTRON mô tả mô hình vật lý mô phỏng lan truyền bức xạ hạt nhân của chùm electron trong các mẫu vật liệu mỏng, sử dụng phương pháp Monte-Carlo để mô phỏng các đại lượng ngẫu nhiên tham gia vào mô hình này (quãng chạy tự do trung bình, các góc bay sau tán xạ của electron,…). Chương trình sẽ tính xác suất để chùm electron bị hấp thụ trong lớp vật liệu, xác suất truyền qua và xác suất để electron bi bay ngược lại (back scattering). Các xác suất này cần để hiệu chính số liệu thực nghiệm BRIKEN.

hncao8

Ảnh: a) Mô phỏng monte-carlo quỹ đạo của 250 electron có năng lượng 100
và 400 keV đi qua các mẫu vàng và silic mỏng dày 1000 A.
b) Quỹ đạo của 100 electron có năng lượng 20 keV khi lan truyền qua mẫu đồng.

 Trung tâm Vật lý tính toán đã xây dựng chương trình sử dụng Giao thức truyền thông điệp (MPI) để nối kết song song hóa tính toán mô hình hóa bức xạ phân tử từ vỏ sao và bức xạ maser tái tổ hợp của nguyên tử hydro từ vỏ sao MWC 349A (nằm trong hệ sao đôi cách hệ Mặt trời khoảng 1.2 kpc). Bằng cách so sánh giữa số liệu quan sát thiên văn vô tuyến với độ phân giải cao và kết quả tính toán mô phỏng sẽ cho phép xác định chính xác các thông số vật lý của hệ sao cũng như điều kiện vật lý trong vỏ sao già. Thông số đầu vào của phần mềm mô phỏng bao gồm hình học và thông số vật lý của vỏ sao, điều kiện kích thích phân tử hoặc nguyên tử hydro. Kết quả tính toán là phân bố mật độ dân số của từng mức năng lượng, cường độ vạch phát xạ.

hncao9
Ảnh: a) Sơ đồ phân bố vật chất và động học của vỏ sao MWC 349A.
b) Cường độ các vạch maser từ vỏ sao MWC 349A.

hncao10
Ảnh: a) Phát xạ của vạch H30α tại các vận tốc khác nhau.
b) Phân bố thông số bão hòa của vạch maser H30α

 Nhóm nghiên cứu Vật lý thiên văn đã tiến hành mô phỏng thủy động lực học ảnh hưởng hấp dẫn của sao đồng hành lên cấu trúc vỏ sao già và tính toán dự đoán phát xạ của phân tử CO trong trường hợp này. Các kết quả mô phỏng cho thấy tương tác giữa sao đồng hành và vỏ sao tạo ra cấu trúc xoắn ốc với chu kỳ đúng bằng chu kỳ quỹ đạo của sao đồng hành. Đây chính là mặt sóng va chạm gây ra bởi lực hấp dẫn của sao đồng hành cùng với chuyển động quỹ đạo của nó. Bức xạ từ phân tử CO cho thấy tại các vận tốc khác nhau phân bố không gian của bức xạ đều cho thấy dạng xoắn ốc. Tuy nhiên hình dạng chính xác còn tùy thuộc vào góc quan sát.

hncao11
Ảnh: Phân bố cường độ bức xạ phổ quay J=1-0 của phân tử CO từ vỏ sao già (primary)
dưới ảnh hưởng của sao đồng hành (secondary).

Tại Viện Kỹ thuật nhiệt đới, các nhà khoa học do PGS.TS. Đinh Thị Mai Thanh chủ trì đã sử dụng hệ thống máy tính hiệu năng cao để mô phỏng, tối ưu hoá cấu trúc và tính toán các tính chất quang điện cũng như vận chuyển điện tích của các hợp chất hữu cơ dị vòng ngưng tự chứa silole và thiophene ứng dụng làm vật liệu bán dẫn hữu cơ. Đề tài cũng đã hợp tác với nhóm thực nghiệm tổng hợp hữu cơ trường Đại học Sư phạm Hà Nội tổng hợp thành công 1 số hợp chất hữu cơ chứa thiophene có khả năng phát quang. Ngoài ra kết quả tính toán của đề tài đã được sử dụng, kết hợp với nhóm các nhà khoa học thực nghiệm tổng hợp thiết bị điện tử ở Trường đại học Haselt – Vương quốc Bỉ để chế tạo thành công 01 đèn OLED. Với kết quả đề tài đạt được đã giúp phát triển hướng nghiên cứu tỉnh toán mô phỏng vật liệu bán dẫn hữu cơ, định hướng sử dụng làm vật liệu truyền dẫn trong thiết bị quang điện tại Viện Kỹ thuật nhiệt đới.

hncao12
Ảnh: a) Hợp chất dị vòng thiophene có khả năng phát quang đã được tổng hợp trong đề tài dựa trên kết quả tính toán mô phỏng. b) OLED được chế tạo thành công trong đề tài nhờ kết hợp giữa mô hình tính toán và thực nghiệm.

Các nhà khoa học thuộc Trung tâm Tin học và Tính toán do TS. Tạ Tuấn Anh làm chủ nhiệm đã xây dựng thành công 01 hệ thống hạ tầng lưu trữ dữ liệu cỡ lớn trên nền tảng điện toán đám mây và hiệu năng cao nhằm phục vụ cho nhu cầu sử dụng dữ liệu ngày càng lớn ở trong và ngoài Viện Hàn lâm. Kết quả thu được là các hệ thống lưu trữ song song phân tán/dữ liệu lớn/dữ liệu có cấu trúc trên hệ thống hiệu năng cao; lưu trữ và chia sẻ dữ liệu theo mô hình điện toán đám mây.

hncao13
Ảnh: Hệ thống tính toán hiệu năng cao đặt tại Trung tâm Tin học và Tính toán 

Hệ thống tính toán hiệu năng cao do TTTHTT vận hành hiện nay đang cung cấp dịch vụ tính toán khoa học cho không chỉ những nhóm nghiên cứu trực thuộc Viện Hàn lâm KHCNVN, mà còn chia sẻ năng lực tính toán và lưu trữ cho rất nhiều nhà khoa học trong và ngoài nước từ các đơn vị có nhu cầu tính toán các bài toán khoa học lớn với tần suất cao như Viện Dầu khí, các trường đại học, thậm chí từ Nhật Bản:

hncao14
Ảnh: Danh sách thống kê người dùng hạ tầng TTHNC trong một thời điểm

Trung tâm Tin học và Tính toán đã và đang nỗ lực xây dựng và phát triển Hệ thống tính toán hiệu năng cao hoàn chỉnh, ổn định lâu dài với năng lực tính toán có thể nói thuộc hàng đầu cả nước có thể đáp ứng đủ nhu cầu tính toán cho nghiên cứu khoa học trên toàn Viện Hàn lâm KHCNVN ở hiện tại và trong tương lai, cũng như đáp ứng được nhu cầu tính toán của các trường, các Viện nghiên cứu khoa học khác trong cả nước, khu vực và hợp tác quốc tế.

 

Minh Tâm