Dữ liệu quan trắc môi trường có thể đến từ thiết bị, phòng thí nghiệm, file nhập tay hoặc hệ thống đối tác. API tích hợp là lớp quan trọng giúp dữ liệu đi vào hệ thống một cách có kiểm soát.
Chuẩn dữ liệu đầu vào
Một bản ghi quan trắc tối thiểu cần có điểm đo, thông số, giá trị, đơn vị đo, thời gian ghi nhận, nguồn dữ liệu và trạng thái chất lượng. Nếu thiếu các trường này, việc phân tích và đối chiếu sau này sẽ khó khăn.
Nên thống nhất mã thông số và đơn vị đo thay vì để thiết bị gửi tự do. Nếu cần chuyển đổi đơn vị, hệ thống phải ghi nhận rõ quy tắc chuyển đổi.
- Mã điểm đo và thông số phải tồn tại trong danh mục.
- Thời gian cần có múi giờ hoặc quy ước thống nhất.
- Dữ liệu gửi trùng cần được nhận diện và xử lý.
Xác thực nguồn gửi dữ liệu
API cần xác thực thiết bị hoặc hệ thống gửi dữ liệu. Token, chữ ký request hoặc khóa riêng theo thiết bị giúp hạn chế dữ liệu giả mạo và hỗ trợ truy vết nguồn lỗi.
Ngoài xác thực, nên có giới hạn tốc độ và giới hạn kích thước payload để bảo vệ hệ thống khi thiết bị lỗi hoặc gửi dữ liệu quá nhiều.
Kiểm tra bất thường trước khi lưu chính thức
Không phải dữ liệu nào nhận được cũng nên đưa ngay vào báo cáo. Hệ thống có thể lưu dữ liệu thô, đánh dấu nghi ngờ và chỉ đưa vào tập dữ liệu chính thức sau khi qua quy tắc kiểm tra.
Các quy tắc có thể gồm kiểm tra khoảng giá trị, tốc độ thay đổi, thiếu dữ liệu theo chu kỳ hoặc sai đơn vị đo.
Tóm tắt ý chính
- API quan trắc cần chuẩn điểm đo, thông số, thời gian và đơn vị.
- Nguồn gửi dữ liệu phải được xác thực.
- Dữ liệu bất thường cần được đánh dấu trước khi dùng cho báo cáo.