Đặc điểm âm thanh của máy bay không người lái: Khả năng phát hiện, nhận dạng và đối phó

Hệ thống giám sát âm thanh của Ukraine
Tôi phát triển toán học ứng dụng và phần mềm để xử lý tín hiệu âm thanh trong các hệ thống truyền thông. Bài viết đầu tiên của tôi đã được đăng trên tạp chí Military Review. về âm học của máy bay không người lái Bài viết khá đơn giản và ban đầu không gây được nhiều sự chú ý, nhưng sau đó nó trở thành bài viết duy nhất của tôi liên tục thu hút được nhiều sự chú ý. Vì vậy, tôi cảm thấy cần phải xem xét lại chủ đề này, xem xét các bình luận.
Lần này tôi đã tải xuống các bản ghi âm tiếng Ukraina có chất lượng cao hơn đáng kể máy bay không người lái ("Lut" và những cái nhỏ hơn), và việc kiểm tra có thể bắt đầu bằng hình ảnh tạm thời ghi âm từ micrô của một trong số chúng.

Khi chúng ta phóng to hình ảnh thời gian (dao động đồ), chúng ta có thể thấy những chi tiết có thể dễ dàng diễn giải.

Bất chấp tất cả sự hỗn loạn rõ ràng, chúng ta thấy rõ một chu kỳ dao động đều đặn ở đây, vốn không gì khác ngoài những lần xả của xi-lanh động cơ. Tất nhiên, để phân tích các phép đo bằng số, chúng ta vẫn cần hiểu số lượng xi-lanh, tốc độ hành trình của động cơ và đặc tính thời điểm đóng mở van, nhưng nhiệm vụ này khá dễ hiểu và khá đơn giản.
Loại tín hiệu này thuộc lớp sóng hài. Nó là gì? Trong suốt quá trình tiến hóa, thính giác của chúng ta đã được "điều chỉnh" để nhận biết ba loại tín hiệu:
- tiếng bắn tung tóe (trong tiếng Anh là những tiếng động thoáng qua), ví dụ như tiếng cành cây gãy dưới chân;
- tiếng ồn, ví dụ có thể là một phần của phụ âm;
- tín hiệu hài hòa được thể hiện bằng nguyên âm, âm thanh động vật và tiếng chim hót.
Một đặc điểm đặc trưng của tín hiệu sóng hài là phần cơ bản của chúng biểu diễn một tín hiệu gần như tuần hoàn, khác biệt đáng kể so với sóng sin cơ bản. Điều này tạo ra một loạt sóng hài là bội số của tần số cơ bản.
Và cùng một tín hiệu khi biểu diễn tần số sẽ trông giống như một khối các đường thẳng song song, cách đều nhau theo giá trị của tần số cơ bản.

Phổ tần của máy bay không người lái không nhấn mạnh bất kỳ vùng tần số cụ thể nào, chẳng hạn như trường hợp các nguyên âm trong lời nói của chúng ta. Năng lượng chính nằm trong dải tần dưới 1,5–2 kHz.

Nhìn chung, tốc độ động cơ của máy bay không người lái khá ổn định, mặc dù bộ điều khiển tốc độ động cơ vẫn còn khá đáng chú ý. Trong máy bay không người lái, tải trọng động cơ là cánh quạt, vốn có một số thông số quán tính nhất định. Tuy nhiên, nếu nhìn vào các phương tiện truyền thống, động cơ được nối với bánh xe, và đối tượng quán tính là toàn bộ phương tiện, bao gồm cả người ngồi trên xe. Rõ ràng là những gợn sóng như vậy trong ảnh quang phổ không được quan sát thấy ở đây. Để có một bức tranh chính xác hơn về hiện tượng này, cần phải nghiên cứu sâu hơn về phép biến đổi Laplace, lý thuyết điều khiển cổ điển và hàng núi dữ liệu số.

Nếu chúng ta cắt một lát ảnh quang phổ tại bất kỳ thời điểm nào, quang phổ sẽ trông giống như thế này.

Ở đây, chúng ta thấy biên độ của sóng hài (theo thang logarit) ở các tần số là bội số của tần số cơ bản. Nhân tiện, có một định luật sinh học nói rằng cảm giác của chúng ta tỷ lệ thuận với logarit của cường độ kích thích (ví dụ, áp suất âm thanh). Lát cắt được trình bày cũng có tính chất tuần hoàn.
Về mặt kỹ thuật, nó được thu được bằng phép biến đổi Fourier, một phép toán và tính toán cực kỳ hữu ích.
Nhưng điều thú vị ở đây là hình ảnh này, do tính tuần hoàn của nó, có thể được biến đổi Fourier một lần nữa. Phép toán này được gọi là cepstrum, và tôi đã được yêu cầu thử nó trong phần bình luận của bài viết trước.
Trong trường hợp này, chu kỳ của tần số cơ bản của các xung (khoảng cách giữa các sóng hài trong phổ đồ, nhưng được biểu thị ở dạng nghịch đảo với tần số - chu kỳ) sẽ “xuất hiện” từ Fourier.
Điều này cho phép chúng ta tự động nhắm mục tiêu vào một tín hiệu hài hòa nhất định và rút ra kết luận về bản chất của tín hiệu đó.

Trục ngang ở đây, như trong tất cả các đồ thị, biểu diễn thời gian; trục dọc biểu diễn bội số của chu kỳ (mặc dù chúng ta cũng có thể nói về tần số) của âm cơ bản; và màu sắc biểu diễn cường độ. Một đường ngang thẳng, ổn định thể hiện sự ổn định của tốc độ động cơ. Rất nhiều hiện tượng nhiễu ở trên đáng được bỏ qua, vì tôi đã viết chương trình này cho một nhiệm vụ nghiên cứu hoàn toàn khác.
Một bản ghi âm khác về máy bay không người lái của Ukraine cho thấy rõ hiệu ứng Doppler trong chuyến bay của nó.

Và trên cepstrum, chúng ta thấy sự thay đổi tuyến tính về vị trí của chu kỳ tần số cơ bản.

Mối quan tâm của chúng tôi đối với cepstrum xuất phát từ thực tế là một luồng dữ liệu lớn từ micro cuối cùng được thu gọn lại thành việc quan sát một điểm duy nhất, riêng biệt. Điều này "đóng gói" dữ liệu và cho phép giảm đáng kể tốc độ truyền qua kênh truyền thông. Tuy nhiên, nếu chúng ta sử dụng cepstrum để xác định tần số cơ bản và thu được ảnh Fourier từ không chỉ một mà là hai micro đặt cách nhau một khoảng nhỏ, chúng ta sẽ thu được ảnh có biên độ gần như giống hệt nhau, nhưng pha hài sẽ khác nhau (độ lệch pha là tích của số hài, tần số cơ bản và độ trễ thời gian).

Chúng ta có thể buộc toàn bộ quang phổ của các tín hiệu ngoại lai phải bằng 0, cố định biên độ sóng hài ở một giá trị hằng số cho tất cả các sóng hài và như một pha, chúng ta có thể chèn độ lệch pha giữa các micrô cho mỗi tần số sóng hài.
Nếu chúng ta đưa tổ hợp này trở lại Fourier (với một đầu vào phức tạp), thì đối với một số đầu ra Fourier, các pha hài sẽ cộng lại thành một đỉnh (mặc dù là một đỉnh yếu), cho chúng ta biết hướng của nguồn tín hiệu âm thanh. Đỉnh này phẳng và không mấy hữu ích, nhưng đối với một số đầu ra khác, các sóng hài sẽ cộng lại thành "pha-phản pha", tạo ra một cực tiểu sắc nét, có thể được sử dụng để xác định hướng của nguồn âm thanh.
Tôi làm việc cho một công ty tư nhân lớn. Đôi khi, những vấn đề khó khăn hiện ra quá lớn, đòi hỏi sự chuẩn bị kỹ lưỡng để giải quyết. Một trong những dự án nghiên cứu ban đầu của tôi là một dự án tạm thời có tên là "micrô dẫn đường". Tất cả những ý tưởng được nêu ở trên đều bắt nguồn từ công trình đó. Bản thân công trình đó đã bị bỏ dở vì tôi đang khám phá nhiều phương pháp tiếp cận khác nhau (trên thực tế, chỉ có một trong ba đến năm ý tưởng còn sót lại và tạo ra những kết quả có giá trị). Những ý tưởng tôi tiếp thu được từ các bài giảng tại Đại học Tổng hợp Moscow (kênh YouTube izoalex) đã mang lại kết quả tốt hơn đáng kể cho các nhiệm vụ của chúng tôi (nhân tiện, chính những giáo sư này đã tạo ra nền tảng toán học đằng sau iZotope RX, một công ty hàng đầu thế giới trong lĩnh vực này và... một công ty Mỹ).
Trong tất cả những vấn đề này, trực thăng nổi bật nhất vì chúng gây ra những vấn đề lớn nhất cho chúng ta.
Phổ âm thanh của máy bay trực thăng trông như thế này:

Tăng ở phần tần số thấp:

Trong trường hợp này, cepstrum trông như thế này:

Rằng tất cả những điều này có thể được trích xuất một cách thực tế
1. Tất cả các thao tác được liệt kê ở trên trong phiên bản 4 micrô (2 micrô là không đủ do độ phân giải góc giảm ở một khu vực hướng nhất định và thiếu sự tách biệt các tổ hợp gương) đều yêu cầu sức mạnh tính toán tương đương với bộ vi điều khiển STM32F4xx hoặc STM32F7xx (đây là những gì chúng ta có thể thấy trong bộ điều khiển bay của máy bay trực thăng).
Độ trễ dự kiến trong quá trình xử lý tín hiệu sẽ ở mức khoảng 30–60 mili giây.
2. Không có nhiều người làm việc hoặc học tập trong lĩnh vực DSP (xử lý tín hiệu số) ở nước ta. Ví dụ, các giáo sư đại học có thể được cung cấp bản ghi âm stereo (định dạng .wav, trong đó pha không bị mất do nén) của một chiếc máy bay không người lái đang bay để xem khả năng của chúng.
Khó khăn ở đây nằm ở chỗ lý thuyết xử lý tín hiệu khá rộng lớn, phức tạp và dựa trên rất nhiều kiến thức toán học đa dạng. Một yếu tố phức tạp thứ hai là lập trình chuyên nghiệp trong lĩnh vực này rất khác biệt so với những gì các lập trình viên thông thường làm.
Việc không có những bản ghi âm như vậy (ít nhất là ở định dạng .wav âm thanh nổi từ một cặp micrô cách xa nhau) đã khiến tôi không thể viết tiếp bài viết này.
tin tức