Liên kết website
Thống kê truy cập
Đang trực tuyến : 3187
Tổng truy cập : 57,998

Thông tin kết quả nhiệm vụ KH&CN

Nghiên cứu sử dụng dữ liệu lớn (Bigdata) và học máy (machine learning) để xây dựng phương pháp tự động phân loại lớp phủ mặt đất phục vụ kiểm kê phát thải khí nhà kính Quốc gia (25/11/2024)

Biến đổi khí hậu và nước biển dâng đang là mối quan tâm của nhân loại bởi các ảnh hưởng tiêu cực trực tiếp tới cuộc sống của con người bao gồm xói lở, trượt đất, sụt lún bề mặt, sa mạc hóa và ngập lụt. Nguyên nhân gây ra Biến đổi khí hậu và nước biển dâng là sự ấm dần lên của trái đất đến từ quá trình phát thải khí nhà kính ngày càng tăng do các hoạt động sinh sống và sản xuất của con người gây ra. Do đó, hiểu rõ bản chất của quá trình phát thải khí nhà kính, đặc biệt do sự tác động của con người lên lớp phủ bề mặt trái đất thông qua các hoạt động kinh tế xã hội đóng vai trò quan trọng trong việc cắt giảm phát thải khí nhà kính trong tương lai trên toàn cầu. Hiện nay, Cục Viễn thám quốc gia đã hoàn thành bộ dữ liệu cho chu kỳ 2008-2018 và chuyển giao cho Cục Biến đổi khí hậu để xây dựng báo cáo khí thải trong lĩnh vực AFOLU. Bộ dữ liệu này được xây dựng theo phương pháp thủ công, giải đoán ảnh bằng mắt trên nền ảnh vệ tinh Landsat. Độ chính xác của bộ dữ liệu này hiện nay không được cao như kỳ vọng, không đảm bảo tính nhất quán về chất lượng do phân loại hoàn toàn phụ thuộc vào tính chủ quan cảm tính của người thực hiện, đặc biêt sản phẩm sẽ không đảm bảo độ chính xác khi giải đoán trên nền ảnh độ phân giải thấp.

Với mục tiêu xây dựng mô hình tự động phân loại lớp phủ mặt đất phục vụ kiểm kê khí nhà kính quốc gia bằng dữ liệu ảnh viễn thám dựa trên phương pháp phân tích Dữ liệu lớn (bigdata) và thuật toán Học máy (Machine Learning) và Xây dựng quy trình công nghệ và dự thảo quy định kỹ thuật để phân loại lớp phủ mặt đất phục vụ tính toán phát thải khí nhà kính dựa trên phương pháp phân tích Dữ liệu lớn (bigdata) và thuật toán Học máy (Machine Learning). Trung tâm Kiểm định chất lượng sản phẩm và Phát triển ứng dụng viễn thám - Cục Viễn thám quốc gia đã triển khai đề tài “Nghiên cứu sử dụng dữ liệu lớn (Bigdata) và học máy (machine learning) để xây dựng phương pháp tự động phân loại lớp phủ mặt đất phục vụ kiểm kê phát thải khí nhà kính Quốc gia” do ThS. Vũ Thị Tuyết làm chủ nhiệm. Kết quả đề tài có ý nghĩa hết sức quan trọng trong việc đẩy mạnh ứng dụng công nghệ viễn thám trong các lĩnh vực của ngành tài  nguyên và môi trường. Nghiên cứu thành công đề tài sẽ cung cấp cho đơn vị một công cụ tiên tiến phục vụ đẩy nhanh tiến độ xây dựng dữ liệu lớp phủ mặt đất và nâng cao độ chính xác của dữ liệu theo yêu cầu của quốc tế.

Để tìm ra mô hình phân loại phù hợp với khu vực nghiên cứu, nhóm thực hiện đề tài đã chọn vùng Tây Bắc, và vùng Tây Nam Bộ mỗi khu vùng 01 tỉnh, dữ liệu huấn luyên phục vụ thử nghiệm mô hình bằng cách đoán đọc ảnh vệ tinh độ phân giải cao. Sau đó, sử dụng ba thuật toán Random Forest, Support Vector machine và k-Nearest neighbour để phân loại độc lập. Kết quả phân loại được so sánh để lựa chọn mô hình có độ chính xác và ổn định nhất để thử nghiệm cho toàn khu vực nghiên cứu thử nghiệm. Tổng quát, các bước thực hiện như sau:

Bước 1: ảnh vệ tinh được thu thập cho các năm nghiên cứu, các ảnh được lựa chọn với tiêu chí có độ phủ mây ít hơn 25%.

Bước 2: xử lý mây bằng cách sử dụng thuật toán Fmask.

Bước 3: xây dựng bộ mẫu huấn luyện và kiểm định mô hình. Bộ mẫu này được tạo ra bằng cách đoán đọc ảnh vệ tinh độ phân giải cao, được cung cấp bởiGoogle earth engine.

Bước 4: Huấn luyện mô hình. Dữ liệu huấn luyện mô hình sẽ được đưa vào huấn luyện lần lượt các mô hình phân loại Random Forest, Support Vector machine, và K-Nearest Neighbour, các mô hình này sau khi huấn luyện được sử dụng để phân loại ảnh viễn thám đã thu thập từ bước đầu tiên.

Bước 5: Kiểm định mô hình. Kết quả phân loại sau đó được đánh giá độ chính xác, làm cơ sở để lựa chọn mô hình phân loại phù hợp

Kết quả cho thấy thuật toán Random forest cho kết quả chính xác hơn đối với tập dữ liệu có số lượng điểm huấn luyện thấp (20 điểm), trong khi thuật toán SVM và k-NN cần số lượng điểm huấn luyện nhiều hơn để có thể đạt độ chính xác tương đương. Thuật toán Random forest cho ra kết quả gần với 1 ở số lượng điểm 50, có nghĩa là có sự đồng nhất trong việc giải đoán, hay kết quả phân loại có độ tin cậy cao hơn các phương pháp khác. Thuật toán k-NN thường cho kết quả chính xác ở những khu vực tương đối đồng nhất, dễ lấy mẫu phân loại, do ít có khả năng gặp phải các điểm outlier trong khu vực lấy mẫu. Thuật toán SVM cho ra kết quả chính xác khi có số lượng điểm lấy mẫu nhiều nhất (50 điểm), tuy nhiên chỉ số Kappa của thuật toán SVM không cao như của thuật toán Random forest. Tóm lại, đối với các khu vực khó lấy mẫu, số lượng mẫu huấn luyện ít, mô hình phân loại random forest tỏ ra có ưu điểm vượt trội hơn. Bên cạnh đó, nhóm nghiên cứu đã xây dựng phần mềm tự động phân loại lớp phủ mặt đất dựa trên dữ liệu lớn và học máy. phần mềm thực hiện việc phân loại lớp phủ mặt đất tự động dựa trên công nghệ Google Earth Engine và học máy, giúp cho việc thực hiện phân loại lớp phủ mặt đất được thực hiện nhanh chóng và hiệu quả.

Nhóm nghiên cứu đã xây dựng thành công quy trình công nghệ và quy định kỹ thuật. quy trình công nghệ này giới hạn trong mục tiêu đặt hàng đề ra là sử dụng dữ liệu lớn và học máy để phân loại lớp phủ mặt đất bằng ảnh viễn thám được cung cấp miễn phí để tính toán phát thải lĩnh vực AFOLU.

Sơ đồ quy trình công nghệ phân loại lớp phủ bằng ảnh viễn thảm dựa trên dữ liệu lớn và học máy.

Từ quy trình công nghệ đã được xây dựng, nhóm nghiên cứu Dự thảo quy định kỹ thuật sử dụng dữ liệu lớn và học máy để phân loại lớp phủ được xây dựng nhằm mục đích: Thống nhất quy trình, phương pháp và tiêu chuẩn kỹ thuật sử dụng dữ liệu lớn và học máy để phân loại lớp phủ phục vụ kiểm kê phát thải khí nhà kính quốc gia; Đảm bảo tính chính xác, tin cậy và hiệu quả của các sản phẩm phân loại lớp phủ phục vụ kiểm kê phát thải khí nhà kính quốc gia.

Kết quả của đề tài sẽ sẽ đóng góp cơ sở khoa học và thực tiễn trong việc xây dựng phương pháp luận và Quy trình công nghệ tự động phân loại lớp phủ bề mặt đất bằng công nghệ viễn thám dựa trên nền công nghệ 4.0 phục vụ tính toán phát thải khí nhà kính cho Việt Nam. Thông qua thực hiện việc nghiên cứu đề tài sẽ hình thành được một đội ngũ cán bộ khoa học có năng lực, kinh nghiệm trong lĩnh vực công nghệ viễn thám và công nghệ thông tin. Đồng thời Sản phẩm của đề tài là công cụ mới cho công tác kiểm kê phát thải khí nhà kính, đây là sự cải tiến trong công nghệ sẽ mang lại hiệu quả về kinh tế cao, tiết kiệm chi phí, rút ngắn thời gian và sức lực của người lao động. 

Có thể tìm đọc toàn văn Báo cáo kết quả nghiên cứu dự án tại Trung tâm Thông tin,Thống kê Khoa học và Công nghệ./.