GOFA – Chi tiết quy trình thu thập, xử lý dữ liệu trước khi cập nhật đến người dùng

Trên thực tế, dữ liệu giao thông trên mọi cung đường không có tính cố định, tức là có khả năng thay đổi tùy theo tình hình thực tế tại địa phương. Bên cạnh đó, tình hình giao thông của xe cộ trên đường còn có thể bị ảnh hưởng bởi các sự cố bất khả kháng như ngập lụt, tắc đường, tai nạn. Bản đồ số, vì thế, cần thường xuyên cập nhật theo thông tin theo thực tế, để đảm bảo các chuyến đi của người dùng được an toàn nhất.

Đó cũng là lý do một trong những tiêu chí hàng đầu của GOFA là liên tục cập nhật dữ liệu mọi cung đường tại Việt Nam một cách nhanh nhất, chính xác nhất đến những người lái xe ô tô. Dưới đây là chi tiết quy trình GOFA thực hiện từ thu thập, xử lý, đến cung cấp dữ liệu giao thông cho người dùng.

1. Thu thập dữ liệu

Bước 1: Thu thập dữ liệu
Bước 1: Thu thập dữ liệu

Trước tiên, để có thông tin chính xác tới người dùng, đội ngũ phát triển GOFA cần tập trung toàn lực trong việc khảo sát thực tế và thu thập thông xin bằng camera hành trình trên ô tô, đảm bảo bao quát tất cả các tuyến đường quan trọng tại các tỉnh, thành phố.

Trong đó, các thông tin được thu thập bao gồm:

  • Thông tin giao thông: Sự thay đổi trong các biển báo giao thông trên các cung đường, phân chia làn đường,…
  • Thông tin địa chỉ, địa điểm: Thông tin về các địa điểm mới, hoặc các địa điểm cũ được thay đổi

Việc thu thập dữ liệu được đội ngũ GOFA thực hiện hàng tuần, hàng tháng, đảm bảo duy trì những thông tin mới nhất tới người dùng.

2. Tiền xử lý dữ liệu

Bước 2: Tiền xử lý dữ liệu
Bước 2: Tiền xử lý dữ liệu

Trước khi xử lý dữ liệu, một bước rất quan trọng mà đội ngũ phát triển cần làm là thay đổi kích thước mẫu, xử lý nhiễu dữ liệu thô nhận về để đảm bảo có chất lượng tốt nhất đưa vào hệ thống trí tuệ nhân tạo để nhận diện. Cụ thể:

2.1. Thay đổi kích thước (Resize)

Trong quá trình thu thập dữ liệu bản đồ số, có thể thu thập được các hình ảnh với kích thước khác nhau từ các nguồn khác nhau. Do đó, để đảm bảo dữ liệu đưa vào hệ thống trí tuệ nhân tạo có chất lượng tốt nhất, trước tiên ảnh cần được thay đổi kích thước phù hợp với yêu cầu của mô hình.

Quá trình thay đổi kích thước sẽ điều chỉnh kích thước chiều rộng và chiều cao của ảnh, đồng thời tuân thủ tỷ lệ ảnh ban đầu để tránh bị méo hoặc biến dạng. Việc điều chỉnh kích thước ảnh thu thập được giúp tối ưu hóa việc xử lý dữ liệu bản đồ số, cho phép mô hình trí tuệ nhân tạo làm việc hiệu quả và chính xác hơn. Sau đó, ảnh sẽ được chuẩn bị sẵn sàng cho các bước tiếp theo trong quy trình xử lý dữ liệu, bao gồm việc xử lý nhiễu dữ liệu thô và nhận diện thông qua hệ thống trí tuệ nhân tạo.

2.2. Xử lý nhiễu dữ liệu (Denoising) 

Bước này tập trung vào việc khử nhiễu dữ liệu ảnh (denoising) – một bước quan trọng đối với lĩnh vực xử lý ảnh, đồng thời có nhiều ứng dụng đa dạng như trích xuất thông tin, nhận dạng đối tượng, phân tích hình ảnh y tế,… Mục tiêu chính của bước khử nhiễu là cải thiện chất lượng của hình ảnh bằng cách loại bỏ các pixel hoặc mẫu không mong muốn xuất hiện do quá trình quét hoặc chụp. Thực hiện tốt việc khử nhiễu chính là tiền đề để có được dữ liệu hình ảnh “sạch” với chất lượng cao, giúp cải thiện chất lượng của quá trình sau trích xuất.

Quy trình khử nhiễu của GOFA sử dụng mô hình tổng hợp (Generative Models) – chủ đề được nghiên cứu rộng rãi nhất trong lĩnh vực Học máy và đặc biệt là Học sâu. Cụ thể là Mạng đối nghịch tạo sinh (Generative Adversarial Networks – GAN) – bước đột phá lớn, được huấn luyện để tạo ra dữ liệu mới có chất lượng cao, bao gồm xử lý ảnh, tạo ảnh, và nhiều ứng dụng khác.

3. Nhận diện và kiểm tra chất lượng dữ liệu

Bước 3: Nhận diện và kiểm tra chất lượng dữ liệu
Bước 3: Nhận diện và kiểm tra chất lượng dữ liệu

Tiếp theo, GOFA tập trung vào 2 mục tiêu chính: nhận diện các biển báo giao thông và kiểm tra chất lượng dữ liệu sau khi xử lý.

3.1. Nhận diện biển báo giao thông

Sau khi dữ liệu thu thập trải qua bước 2 – Tiền xử lý, sẽ được đưa vào mô hình trí tuệ nhân tạo để nhận diện các biển báo giao thông. Mô hình đã được huấn luyện trên tập dữ liệu giao thông chứa các hình ảnh biển báo giao thông được gán nhãn: Biển báo tốc độ giới hạn, biển báo ra/vào khu dân cư, biển báo cấm vượt/ hết cấm vượt,… nhằm tối ưu hóa việc phân loại chính xác các biển báo được nhận. Nhờ việc huấn luyện mô hình trí tuệ nhân tạo, các dữ liệu hình ảnh biển báo mà đội ngũ GOFA thu thập sẽ được dự đoán và nhận biết chính xác.

3.2. Kiểm tra chất lượng dữ liệu sau khi xử lý

Sau khi nhận diện biển báo, quá trình kiểm tra chất lượng dữ liệu được thực hiện nghiêm ngặt để đảm bảo tính chính xác và tin cậy của kết quả, trước khi được đưa đến bước hậu xử lý dữ liệu.

4. Hậu xử lý dữ liệu và cập nhật vào hệ thống cơ sở dữ liệu

Bước 4: Hậu xử lý dữ liệu và cập nhật vào hệ thống cơ sở dữ liệu
Bước 4: Hậu xử lý dữ liệu và cập nhật vào hệ thống cơ sở dữ liệu

4.1. Đối chứng dữ liệu và cập nhật vào cơ sở dữ liệu bản đồ số

Sau khi được nhận diện và kiểm tra kỹ càng, kết quả sẽ được đối chứng với cơ sở dữ liệu cũ để tránh xung đột thông tin và đảm bảo tính nhất quán giữa dữ liệu mới và cũ. Các phương pháp đối chứng dữ liệu có thể bao gồm so sánh theo từng thuộc tính, so sánh hình ảnh, hoặc so sánh vị trí địa lý của các biển báo giao thông.

Sau đó, dữ liệu mới được thêm vào cơ sở dữ liệu bản đồ số để cập nhật vào các cung đường. Quá trình này đảm bảo rằng các cung đường trong hệ thống được cập nhật và chính xác với thông tin biển báo giao thông mới nhất.

Ngoài ra, để đảm bảo độ chính xác và tin cậy của dữ liệu cho người dùng cuối, GOFA thêm các cọc dữ liệu trong quá trình hậu xử lý. Đây là các điểm đánh dấu trên bản đồ để chỉ ra vị trí chính xác của biển báo giao thông, giúp đảm bảo dữ liệu được cập nhật đúng vị trí và giảm thiểu sai sót trong việc định vị.

4.2. Kiểm chứng qua thử nghiệm thực tế

Đội ngũ GOFA sẽ kiểm chứng tính chính xác và tin cậy của dữ liệu mới bằng cách sử dụng hệ thống nhận diện biển báo giao thông trên thực tế và so sánh kết quả với dữ liệu đã được cập nhật để đảm bảo rằng thông tin biển báo được hiển thị đúng trên các ứng dụng hoặc hệ thống liên quan.

4.3. Cập nhật phiên bản cơ sở dữ liệu mới nhất qua Cloud

Sau khi hoàn tất các bước từ thu thập cho đến kiểm chứng dữ liệu, phiên bản cơ sở dữ liệu mới nhất được đóng gói, cập nhật và phân phối cho người dùng thông qua Cloud. Do đó, chỉ cần có Internet/ 4G, người dùng có thể truy cập và sử dụng dữ liệu biển báo giao thông mới nhất một cách dễ dàng mà không cần bất kỳ thao tác cập nhật nào.

Trên đây là chi tiết quy trình thu thập, xử lý dữ liệu trước khi GOFA đưa đến tay người dùng bộ dữ liệu thông tin giao thông chính xác nhất, cập nhật nhất, với mục tiêu trở thành bạn đường đáng tin cậy của mọi người lái xe ô tô Việt Nam.

Hiện tại, ứng dụng GOFA vẫn đang hỗ trợ miễn phí cho bất kỳ người dùng nào có mong muốn trải nghiệm. Tải GOFA ngay tại:

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *