Skip to content
Bird Strike2026년 6월 5일 · 2

2초, 40 프레임 — AVIX-AI 탐지 루프 내부

센서 프레임에서 Lattice 엔티티까지 2초 이내. Jetson 급 엣지 하드웨어에서 돌도록 설계된 4단계 파이프라인.

by이현빈

대부분의 컴퓨터 비전 논문은 wall-clock 모델 지연을 보고한다. 우리는 다른 것을 보고한다 — frame in to catalog out. 이 측정은 ingest, inference, tracking, disposition 할당, 그리고 파트너 Lattice 인스턴스로의 publish hop 을 포함한다. 검증 코퍼스 전체의 중앙값: 2초 미만.

이 노트는 그 파이프라인을 연다.

1단계 — 다중 센서 융합

활주로 접근 중인 새는 카메라(가시광 + IR), 솔리드스테이트 레이더(360° sweep), 또는 음향 배열(4채널)로 관측될 수 있다. 단일 센서로는 충분치 않다 — 가시광 카메라는 황혼에 신호를 잃고, 레이더는 작은 조류 단면적에 어려움을 겪으며, 음향은 분주한 공항에서 환경 소음에 제약된다.

1단계는 세 스트림 모두를 센서 비종속 프레임 표현으로 정규화한다. downstream 파이프라인은 결코 "이것은 레이더 리턴이다" 를 보지 않는다 — 신뢰도 점수가 매겨진 탐지가 담긴 프레임만 본다.

2단계 — 프레임 간 Re-ID 추적

단일 탐지는 엔티티가 아니다. 엔티티는 지속하는 것 이다. 우리의 Re-ID 헤드는 프레임 스트림을 소비하여 프레임 간 영속 식별자를 할당한다 — inner marker 를 통과한 새는, 카메라가 바뀌었더라도 30초 후 outer marker 를 통과하는 동일한 새다.

Re-ID 헤드는 작다. 배포 대상은 Jetson Orin Nano 하드웨어다 — 프레임당 200 ms 의 재식별 비용은 감당할 수 없다. 실용 예산: 탐지 + Re-ID 결합 프레임당 ~4 ms.

3단계 — Disposition 할당

이것이 doctrine 레이어다. 기본 disposition 은 NEUTRAL 이다. 에스컬레이션 경로는 명시적이며 동맹 reference 에 결합된다 — 이 디폴트 선택이 왜 doctrinal 인지에 대해서는 Mudflat 노트를 보라. disposition 필드는 LLM 출력이 아니다. 그것은 (종 분류 × 공항 doctrine 룰셋) 의 결정론적 함수다.

종 분류가 불확실하면 엔티티는 _uamkt_extensions:species_confidence 와 함께 출하되어, 운영자가 모호성을 세탁된 채로가 아니라 그대로 볼 수 있도록 한다.

4단계 — 카탈로그 publish

publish 호출은 루프에서 유일한 네트워크 hop 이다. 페이로드 크기는 엔티티당 ~1.2 KB. Lattice Entity API 는 우리 파트너 sandbox 에 대해 중앙값 300 ms 미만으로 PUT 을 수락한다. 우리는 큐를 유지하지 않는다 — back-pressure 는 upstream, 1단계와 2단계에 적용된다.

19/19 검증 런은 시나리오당 4단계를 19회 hit 하며 매번 200 OK 를 기대한다. 그 외 모든 것은 "soft fail" 이 아니라 버그다.

파이프라인이 의도적으로 작은 이유

우리가 추가하는 모든 구성요소는 파트너가 감사해야 할 또 하나의 대상이다. 센서 융합, Re-ID, disposition, publish — 4단계, 각각 필수, 각각 교체 가능. 우리는 매혹적인 추가(이상 탐지, 생성형 장면 추론, 강화학습 컨트롤러)를 거부한다 — 그것들이 disposition 단계가 이미 인코딩한 doctrinal 약정을 흐리게 할 것이기 때문이다.

작은 파이프라인은 점검 가능한 파이프라인이다. 그것이 설계 파라미터다.

문의: ceo@uamkt.com

1차 reference: ICAO Doc 9332 — Manual on the ICAO Bird Strike Information System (4th ed.).

Tags
Bird StrikeComputer visionRe-IDLatency