^
A
A
A

Hlas ako analýza: Včasné signály rakoviny a benígnych lézií

 
Alexey Kryvenko, Lekársky recenzent
Posledná kontrola: 18.08.2025
 
Fact-checked
х

Všetok obsah iLive je lekársky kontrolovaný alebo kontrolovaný, aby sa zabezpečila čo najväčšia presnosť faktov.

Máme prísne smernice týkajúce sa získavania zdrojov a len odkaz na seriózne mediálne stránky, akademické výskumné inštitúcie a vždy, keď je to možné, na lekársky partnerské štúdie. Všimnite si, že čísla v zátvorkách ([1], [2] atď.) Sú odkazmi na kliknutia na tieto štúdie.

Ak máte pocit, že niektorý z našich obsahov je nepresný, neaktuálny alebo inak sporný, vyberte ho a stlačte kláves Ctrl + Enter.

12 August 2025, 08:13

Výskumníci z Oregonskej univerzity zdravia a vedy analyzovali nahrávky reči z nového verejne dostupného súboru údajov Bridge2AI-Voice a našli jednoduchý akustický znak, ktorý dokáže odhaliť patológiu hlasiviek. Hovoríme o pomere harmonických k šumu (HNR) – pomere „hudobných alikvotných tónov“ k šumu. Jeho úroveň a variabilita odlišovali hlasy ľudí s rakovinou hrtana a benígnymi léziami od zdravých a niektorých iných hlasových porúch. Účinok bol obzvlášť zrejmý u cisgender mužov; štatistická významnosť nebola dostatočná u žien – autori vinia malú veľkosť vzorky a vyzývajú na rozšírenie údajov. Práca bola publikovaná ako stručná správa v časopise Frontiers in Digital Health.

Pozadie štúdie

  • Prečo vôbec hľadať „hlasové markery“? Chrapot je častou sťažnosťou. Príčiny sú rôzne: od prechladnutia a refluxu až po uzlíky/polypy a rakovinu hrtana. V súčasnosti je cestou k diagnóze návšteva ORL špecialistu a endoskopia (kamera v nose/krku). Je presná, ale nie vždy rýchlo dostupná a nie je vhodná na domáce samomonitoring. Je potrebný predbežný skríning: jednoduchý spôsob, ako pochopiť, kto by mal ako prvý navštíviť lekára.
  • Čo je hlasový biomarker? Reč je signál, ktorý sa dá ľahko zaznamenať na telefóne. Jej „vzorec“ sa dá použiť na posúdenie vibrácií hlasiviek. Lézie spôsobujú, že vibrácie sú nerovnomerné: viac „šumu“ a menej „hudby“.
  • Prečo sú nové súbory údajov dôležité. Predtým sa takéto práce spoliehali na malé, „domáce“ vzorky – modely boli krehké. Bridge2AI-Voice je rozsiahly, multicentrický, eticky zozbieraný súbor zvukových nahrávok prepojených s diagnózami. Bol vytvorený ako „spoločné testovacie prostredie“ na konečné trénovanie a testovanie algoritmov na veľkých a heterogénnych dátach.
  • Kde sú hlavné ťažkosti?
    • Hlas sa mení v dôsledku mikrofónu, hluku v miestnosti, chladu, fajčenia, jazyka, pohlavia a veku.
    • Tradične je menej údajov o ženách a ženský hlas je častejší – metriky sa správajú odlišne.
    • Žiadny „domáci“ test nemôže nahradiť vyšetrenie ani stanoviť diagnózu – nanajvýš pomôže rozhodnúť sa: „je potrebné urgentne navštíviť ORL špecialistu?“
  • Prečo to klinika a pacienti potrebujú? Ak je možné vybrať ľudí s vysokým rizikom uzlín/nádorov na prioritné vyšetrenie na základe krátkeho termínu, urýchli sa tým diagnostika, zníži sa počet zbytočných odporúčaní a poskytne sa nástroj na samomonitorovanie medzi návštevami (po operácii, počas terapie).
  • Kam by to malo viesť: K validovaným aplikáciám/modulom telemedicíny, ktoré:
    1. napíšte prejav podľa štandardu (fráza + predĺžené „aaa“),
    2. vypočítať základné charakteristiky (HNR, jitter, shimmer, F0),
    3. vydať odporúčanie kontaktovať špecialistu, ak je profil alarmujúci,
    4. udržiavať dynamiku po liečbe.

Myšlienka je jednoduchá: „priložte telefón k uchu ORL lekára“ – nie kvôli diagnóze, ale aby ste neprehliadli tých, ktorí potrebujú rýchlu osobnú pomoc.

Čo presne urobili?

  • Využili sme prvú verziu multicentrického, eticky zozbieraného súboru údajov Bridge2AI-Voice, vlajkového projektu NIH, kde sú hlasové nahrávky prepojené s klinickými informáciami (diagnózy, dotazníky atď.).
  • Boli vytvorené dve analytické vzorky:
    1. „rakovina hrtana / benígne uzliny / zdravé“;
    2. „rakovina alebo benígne uzlíky“ verzus spastická dysfónia a paralýza hlasiviek (ďalšie bežné príčiny chrapotu).
  • Základné hlasové znaky boli identifikované zo štandardizovaných fráz: základný tón (F0), chvenie, trblietanie a HNR a skupiny boli porovnané pomocou neparametrickej štatistiky. Výsledok: najstabilnejšie rozdiely boli v HNR a F0, pričom HNR a jeho variabilita najlepšie odlíšili benígne lézie od normy aj od rakoviny hrtana. Tieto signály boli výraznejšie u mužov.

Prečo je to dôležité?

  • Včasný skríning bez sondy. V súčasnosti cesta k diagnóze často znamená nazoendoskopiu a v prípade podozrenia biopsiu. Ak jednoduché akustické funkcie v kombinácii s umelou inteligenciou dokážu uprednostniť tých, ktorí potrebujú endoskopiu, pacienti sa dostanú k ORL špecialistovi skôr a zníži sa počet zbytočných odporúčaní. Toto je doplnok, nie náhrada lekára.
  • Veľké dáta pre hlas. Bridge2AI-Voice je vzácny projekt, v ktorom sa hlas zhromažďuje pomocou jednotných protokolov a prepája sa s diagnózami; dáta sú výskumníkom dostupné prostredníctvom PhysioNet / Health Data Nexus. To urýchľuje vývoj spoľahlivých hlasových biomarkerov namiesto „zázračných aplikácií“ na malých vzorkách.

Čo je HNR?

Keď hovoríme, hlasivky vibrujú a vytvárajú alikvotné tóny (harmonické). Vibrácia však nikdy nie je dokonalá – v signále je vždy šum. HNR je jednoducho o to, o koľko viac „hudby“ je v hlase ako „syčania“. Keď sú hlasivky poškodené, vibrácia sa stáva menej rovnomernou – je tam viac šumu, HNR klesá a jeho skoky (variabilita) sa zvyšujú. Toto je vzorec, ktorý autori zachytili.

Dôležité vyhlásenia o odmietnutí zodpovednosti

  • Ide o pilotnú, exploratívnu analýzu: bez klinickej validácie, s obmedzeniami vzorky žien – ich účinky teda neboli významné. Sú potrebné väčšie a rozmanitejšie údaje a „praženie“ modelov v rôznych klinikách a v rôznych jazykoch.
  • Hlas je „mnohohodnotová“ vec: ovplyvňuje ho prechladnutie, fajčenie, reflux, mikrofón, hluk v miestnosti. Akýkoľvek „domáci test“ by mal byť schopný zohľadniť kontext – a stále slúžiť ako filter pre odporúčanie k ORL špecialistovi, a nie ako diagnóza stanovená po kliknutí.

Čo bude ďalej?

  • Rozšírte súbor údajov (vrátane žien a vekových kategórií), štandardizujte úlohy a akustiku (čítanie frázy, predĺžené „aaa“ atď.), vyskúšajte multimodálne modely (hlas + dotazníkové symptómy/rizikové faktory).
  • Prepojte akustické znaky s výsledkami vyšetrení (endoskopia, stroboskopia) a dynamikou po liečbe – aby sa profil HNR mohol použiť aj na monitorovanie.
  • Pokračovanie v „otvorenej vede“: Bridge2AI-Voice už publikuje verzie súboru údajov a nástrojov – je to šanca rýchlo osloviť skutočných pilotných projektov v klinikách.

Záver

Z hlasu je možné „počuť“ problémy s hlasivkami – a možno skôr odkázať danú osobu k správnemu špecialistovi. Zatiaľ je to celkom dobrá indícia (HNR a jej variabilita), ale vďaka veľkému množstvu otvorených dát majú hlasové biomarkery konečne šancu stať sa spoľahlivým skríningovým nástrojom.

Zdroj: Jenkins P. a kol. Hlas ako biomarker: Exploratory Analysis for Benign and Malignant Vocal Flushs Lesions. Frontiers in Digital Health, 2025 (prijaté na publikovanie). Údaje — Bridge2AI-Voice (NIH/PhysioNet).

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.