Прескочи към главното съдържание на страницата

Архив


БРОЙ 1 2021

Актуални възможности за аларингеален говор

виж като PDF
Текст A
Асен Асенов1, Николай Сапунджиев2, Благовеста Спасова2, Георги Стоянов3, М. Асенова1
Отделение по УНГ отделение, УМБАЛ „Пловдив”,  гр. Пловдив УС по УНГ болести, МУ-Варна, гр. Варна Катедра по обща и клинична патология, съдебна медицина и деонтология,  МУ-Варна, гр. Варна


Ларингеалният карцином е най-честото малигнено заболяване в областта на глава и шията – на него се падат повече от 30% от случаите в тази област у нас[1]. Данни от Националния раков регистър сочат заболеваемост в България от 554 нови случаи годишно. Повече от 60% от пациентите се диагностицират в авансирал стадий на заболяването, изискващ радикално лечение посредством тотална ларингектомия или различни комбинации от химио и лъчетерапия[2]. Това, което обуславя в най-висока степен инвалидизацията на ларингектомираните пациенти, е загуба на фонаторната функция[3].

Първата ларингектомия е осъществена в Австрия през 1873 г. от Billroth (1829-1894)[3-6]. Още при този първи случай се прави опит за гласова рехабилитация посредством техническо устройство, състоящо се от фарингеална, ларингеална и фонационна канюла и изкуствен епиглотис. Поставянето на този изкуствен ларинкс било трудно, а полученият глас бил с лошо качество. Допълнително аспирацията, честото обтуриране на фонационната канюла от секрети и последваща необходимост от почистване представлявали сериозни предизвикателства при употребата на този тип протеза.

Още от тази пионерска епоха започва търсенето и клиничното експериментиране с различни средства и техники за аларингеален говор. Теорията на гласообразуването е базирана на модела “източник-филтър”. Източник на гласа в норма са гласните връзки. Специфичното последващо филтриране се осъществява от резонаторния модел на гласоформиращите пътища. От тази гледна точка пациентите след ларингектомия са лишени от възможност да генерират и контролират глас от източника, докато функциите на резонаторните пространства са запазени.

Аларингеален говор
Най-универсалният метод за фонация при ларингектомирани е шепотният говор[7]. Осъществява посредством модулирането на няколкото милилитра въздух в устната кухина. Този обем е достатъчен за възпроизвеждането на само една сричка. Разбирането на подобен говор е възможно само в тиха среда и на близко отстояние от пациента[8]. Макар този метод да е почти универсален, поради ниските качества на гласа и неговата екстремна краткост, някои автори го приравняват към комуникация тип „четене на устни“[9].

Езофагеален говор
Езофагеалният говор е бил в основата на гласовата рехабилитация след тотална ларингектомия до въвеждането на хирургичните методи през осемдесетте години на XX век[10]. Първият доклад за употреба на метода е изнесен през 1828 г. във Френската академия на науките от Reprand при пациент с атрезия на ларинкса[11]. Основният механизъм за фонация при езофагеалният говор е сходен на този при еруктация, но се осъществява целенасочено и контролирано. За да осъществи езофагеален говор, пациентът трябва да въведе малко количество въздух в горната част на хранопровода. Непосредствено след това чрез торако-абдоминалната преса контролирано изтласква въздуха от хранопровода, при което се индуцира вибрация на мукозата на неофаринкса която озвучава въздушната колона. Езофагеалният говор се характеризира с краткост и непостоянство на фраза поради малкия въздушен резервоар в хранопровода (40-80 cm3), което е достатъчно за изговарянето на шест до седем срички[11]. Езофагеалният говор е труден за овладяване – между 14 и 76% от пациентите успяват да го използват, като причините за тази широка вариация не са съвсем изяснени[12].

Технически помощни устройства
Пневматичният изкуствен ларинкс се характеризира с тромавия си дизайн и необходимостта от маркуч за предаване на звука към резонаторния тракт. Примери за успешни използвани в практиката пневматични устройства са Van Humen DSPB, разработен в Холандия и Tokyo, разработен в САЩ[11,13]. Получава се гранично от хигиенна гледна точка директно свързване на стомата с устната кухина[14].

Електроларинксът (ЕЛ) е най-често използваният метод за апаратна гласова рехабилитация у нас. Представлява генератор на вибрации в говорния диапазон, който притиснат до мекотъканните стени на фаринкса ги привежда в трептене, което след това се излъчва модулирано през устата. Управлението е ръчно. Въпреки десетилетията на развитие, този вид устройства дават реч с механично звучене и ниска степен на разбираемост[15]. Губи се остатъчната възможност дихателната система да контролира аспекти на фонацията. По-елементарните модели генерират тон с една честота. Следващото по-високо ниво ЕЛ са двубутонните. При тях двата бутона стартират две различни основни честоти. Говорът е битонален.

Следващото по-високо и по-модерно ниво ЕЛ позволява контрол и на основния тон чрез единичен, но многофункционален бутон. Освен включено и изключено състояние същият бутон реагира и на силата на натиск и променя основния тон. Подобна допълнителна функция дава не само по-естествено и изразително звучене на речта. За тоналните езици, при които лексическото значение на думите зависи от промените в тона (напр. Мандарин), тази функция се явява преимущество от критично значение[16]. Фонацията чрез ЕЛ далеч не може да се сравни с тази при използване на гласова протеза по отношение на естественото “човешко” звучене на гласа и на разбираемостта на членоразделната реч[17,18].

UltraVoice представлява комплексна електромеханична протеза с дистанционно управление. Вгражда се в протеза на горната челюст. Основният модул включва високоговорител, защитен със силиконова мембрана от слюнка, напитки и храна. Той се управлява посредством радиосигнал от контролния блок. Превключвателят се поставя във всяка част на тялото, от където може да бъде задействан удобно с волево движение. Съществуват възможности за управление на височината на основния тон и силата му[19].

Гласова рехабилитация посредством гласова протеза
Преди 50 години гласовият рехабилитатор Blom и проф. Singer от Калифорния изобретяват еднопосочна клапа (гласова протеза), която поставят в оперативно създадена фистула между трахеята и хранопровода[14]. При запушване с пръст на трахеостомата и експириум въздухът се насочва към меките тъкани на неохипофаринкса, и предизвиква вибрирането им (Фиг. 1). Получава се говор, подобен на езофагеалния, но с много по-голяма продължителност и интензитет. Днес този способ е златен стандарт в гласовата рехабилитация на ларингектомирани. Самите протези трябва да бъдат подменяни през определен период от време – средно 6 месеца. Има разработени спомагателни клапани, които при по-рязко издишване обтурират стомата и цялото количество въздух се насочва към протезата – пациентът може да възпроизведе говор без да се налага да запушва трахеостомата с пръст.
В литературата са описани различни методи на осъществяване на трахеоезофагеалната фистулизация. Използват се троакари, скалпел или лазер[20-27]. Съществуват известни вариации в оригиналната процедура на Blom и Singer, използващи флексибилин трансназални и трансорални ендоскопи[24]. Специално внимание заслужава ендо/екстраезофагеалната методика на Lichtenberger[21]. Тя позволява фистулата да се направи от предната стена на хранопровода към задната стена на трахеята, като по този начин значително се намалява рискът от увреда на неофаринкса. Предоперативната ви­деофлуороскопия позволява точен избор на размер на гласовата протеза[28]. Повечето проучвания единодушно подкрепят превъзходството на трахеоезофагеалната гласова протеза над електроларинкса по отношение на разбираемостта на речта[18,29-31]. Не случайно тя се приема днес за “златен стандарт”.

Нови експериментални методики
Един от експерименталните все още изкуствени източници на глас е хибридната протеза Bionics Voice[32]. Състои се от три модула:
Хибриден електронен източник на глас (миниатюрен високоговорител), осигуряващ вокалните компоненти и микро-вентилатор, осигуряващ свързаните с въздушния поток компоненти. Комбинираните вокални и пневматични компоненти се предават на резонаторния път.

Комплект датчици за налягане, мониториращи интраоралното и интрастомалното налягания.

Контролен блок, който на база промените в наляганията определя началото и края на фразите, височината на вокалния компонент и обема на добавения въздушен поток.

Едно на пръв поглед елементарно устройство, съставено от повсеместно достъпни в наше време компоненти е PHONETOVOX[33]. Състои се от мобилен телефон с елементарен софтуерен тон-генератор. Това позволява ръчно управление на началото и продължителността на фонацията от чувствителния на допир екран. Височината на тона може да варира в границите на една октава. Така генерираният тон се предава по тръба до фаринкса на пациента. Предварителните проучвания посочват, че лесно се постига разбираемост от около 46% на произнесените думи.

В последните години се експериментира активно с интерфейси за беззвучна реч. Общият им принцип е регистриране на биосигнали с отношение към речта и декодиране от тях на речта и синтезирането ù по дигитален път. Съществуват различни експериментални подходи чрез различни биосигнали. Едната група от тях са базирани на регистрация на видео и образни параметри. Използват или само видеосигнал от устните[34], или видеокамера за регистрация на движенията на устните и ултразвуков трансдюсер за регистрация на интраоралните структури[35]. Друга група биосигнали са свързани с движението на образуващите речта структури в пространството. Използва се електромагнитна артикулография, при която се извършва магнитно проследяване на артикулаторните движения[36,37]. Използват се триизмерни магнитни тракери, прикрепени към върха, гърба и корена на езика, горната, долната устни, двата устни ъгъла, долната челюст и мекото небце. Проследяват се с точност под един милиметър. Повърхностната електромиография (Surface Electromyography – sEMG) регистрира по неинвазивен път композитен сигнал от инервираната от n. facialis лицева мускулатура[38,39]. Включени са всички акционни потенциали на мускулните влакна, разположени под областта на сензора. Експериментира се с единични електроди и матрични електроди. Неинвазивността е предимство, което за момента обяснява защо повечето експерименти с интерфейси за беззвучна реч се базират на sEMG[40].

Фигура 1
а) Схема на нормална анатомия – общи дихателен и храносмилателен път на ниво фаринкс
b) Състояние след ларингектомия с дефинитивно разделяне на дихателния и храносмилателния пътища
c) Гласова протеза, поставена в трахеоезофагеал­на фистула. Еднопосочният клапан предпазва от попадане на храна и течности от фаринкса в трахея, но позволява преминаване на въздух от трахея към неохипофаринкса

Един друг принципно съвсем различен подход е директното декодиране на неврални сигнали от ЦНС, свързани с речта. При електроенцефалографията се регистрира невроналната активност от тези региони на мозъка, които участват в генерирането на речта (ЕЕГ)[41,42]. Този подход на директно използване на регистрация на активността на главния мозък/ЦНС се означава още като мозъчно-компютърен интерфейс (Brain Computer Interface – BCI). Друг подобен метод на регистриране на речево-определяща активност на ЦНС е магнитоенцефалографията. По неинвазивен път се регистрират магнитните полета от мозъчния кортекс, свързани с интрацелуларното постсинаптично предаване в мозъка. С този метод в експериментални условия могат да се декодират до 90% от думите[43].

Загубата на гласа след ларингектомия представлява тежко инвалидизиращо състояние. Подобни пациенти са лишени от възможност да генерират и контролират глас от източника, докато функциите на резонаторните пространства са запазени. Традиционно най-разпространената методика на гласова рехабилитация у нас е чрез електроларинкс. Речта с него е слята, слабо членоразделна. В последните години в практиката ни се утвърждава златния стандарт в световната практика – трахео­езофагеалната фистулизация и рехабилитация чрез гласова протеза. Тя дава по-добро качество на фонация и показва по-добри резултати от електроларинкса както по отношение на разбираемостта, така и на естествеността на звучене[17,18,29]. Запазва се контролиращата и модифициращата ролята на дихателната система. n

книгопис:
1. Stoyanov GS, Kitanova M, Dzhenkov DL, Ghenev P, Sapundzhiev N. Demographics of Head and Neck Cancer Patients: A Single Institution Experience. Cureus. 2017.
2. З. Валерианова, Т. Атанасов МВ. Заболяемост от рак в България, 2014 и 2015. 25th ed. София: Парадигма; 2017.
3. Matev B, Asenov A, Stoyanov GS, Nikiforova LT, Sapundzhiev NR. Losing One’s Voice to Save One’s Life: A Brief History of Laryngectomy. Cureus. 2020;12:e8804.
4. Schwartz AW. Dr. Theodor Billroth and the first laryngectomy. Ann Plast Surg. 1978;1:513–6.
5. Gussenbauer C, Billroth T. Ueber die erste durch Th. Billroth am Menschen ausgeführte Kehlkopf Exstirpation und die Anwendung des künstlichen Kehlkopfes. 1874.
6. Folz BJ, Silver CE, Rinaldo A, Ferlito A. Themistocles Gluck: biographic remarks emphasising his contributions to laryngectomy. Eur Arch Otorhinolaryngol. 2011;268:1175–9.
7. Ackerstaff AH, Hilgers FJM, Aaronson NK, Balm AJM. Communication, functional disorders and lifestyle changes after total laryngectomy. Clin Otolaryngol Allied Sci. 1994;19:295–300.
8. Debry C, Dupret–Bories A, Vrana NE, Hemar P, Lavalle P, Schultz P. Laryngeal replacement with an artificial larynx after total laryngectomy: The possibility of restoring larynx functionality in the future. Head Neck. 2014;36:1669–73.
9. Damsté PH. Methods of restoring the voice after laryngectomy. The Laryngoscope. 1975;85:649–55.
10. Dwivedi R, Jallali N, Chisholm E, Kazi r, Clarke P, Rhys-Evans P, et al. Surgical voice restoration after total laryngectomy: An overview. Indian J Cancer. 2010;47:239.
11. Blom ED. Current status of voice restoration following total laryngectomy. Oncol Williston Park N. 2000;14:915–22; discussion 927-928, 931.
12. Gates GA, Ryan W, Cooper JC, Lawlis GF, Cantu E, Hayashi T, et al. Current status of laryngectomee rehabilitation: I. Results of therapy. Am J Otolaryngol. 3:1–7.
13. Weinberg B, Riekena A. Speech produced with the Tokyo artificial larynx. J Speech Hear Disord. 1973;38:383–9.
14. Singer MI, Blom ED. Medical techniques for voice restoration after total laryngectomy. CA Cancer J Clin. 1990;40:166–73.
15. Meltzner GS, Hillman RE. Impact of aberrant acoustic properties on the perception of sound quality in electrolarynx speech. J Speech Lang Hear Res JSLHR. 2005;48:766–79.
16. Li W, Zhaopeng Q, Yijun F, Haijun N. Design and Preliminary Evaluation of Electrolarynx With F0 Control Based on Capacitive Touch Technology. IEEE Trans Neural Syst Rehabil Eng Publ IEEE Eng Med Biol Soc. 2018;26:629–36.
17. Singer S, Wollbrück D, Dietz A, Schock J, Pabst F, Vogel H-J, et al. Speech rehabilitation during the first year after total laryngectomy. Head Neck. 2013;35:1583–90.
18. Law IK-Y, Ma EP-M, Yiu EM-L. Speech intelligibility, acceptability, and communication-related quality of life in Chinese alaryngeal speakers. Arch Otolaryngol Head Neck Surg. 2009;135:704–11.
19. Traditional Speech Options for Laryngectomees Compared with UltraVoice Plus [Internet]. [cited 2020 Dec 8]. Available from: https://ultravoice.com/laryngectomy-speech-options/
20. Damrose EJ, Cho DY, Goode RL. The hybrid tracheoesophageal puncture procedure: Indications and outcomes. Ann Otol Rhinol Laryngol. 2014;123:584–90.
21. Lichtenberger G. New and simple endo-extra oesophagotracheal method of developing the fistula for implantation of a voice prosthesis. Diagn Ther Endosc. 1997;3:189–91.
22. Pagedar NA, Bayon R, Gudgeon J, Nelson RF, Van Daele DJ, Hoffman HT. Tracheoesophageal puncture with immediate prosthesis placement. Laryngoscope. 2014;124:466–8.
23. Schipper IH. Trokar * zur Anlage einer ösophago-trachealen Fistel bet der sekundären Eintage einer Stimmprothese. 1994;73:660–1.
24. LeBert B, McWhorter AJ, Kunduk M, Walvekar RR, Lewin JS, Hutcheson KA, et al. Secondary Tracheoesophageal Puncture With In-Office Transnasal Esophagoscopy. Arch Otolaryngol Neck Surg. American Medical Association; 2009;135:1190.
25. Brown DH, Evans PHR. A simplified method of tracheoesophageal puncture for speech restoration. Laryngoscope. 1992;102:579–80.
26. Shaw GY, Searl JP. Secondary tracheoesophageal puncture using a KTP laser. Laryngoscope. Lippincott Williams and Wilkins; 2000;110:1574–7.
27. Georgiev G, Ivanova D, Genova P, Asenov A, Sapundzhiev N. Modifizierte Lichtenberger tracheoösophageale Punktionstechnik für Management der inkarzerierten Stimmprothesen. GMS Curr Posters Otorhinolaryngol - Head Neck Surg 12Doc147 [Internet]. 2016 [cited 2019 Feb 21]; Available from: http://www.egms.de/en/journals/cpo/2016-12/cpo001498.shtml
28. Spasova B, Sapundzhiev N, Ivanova D, Balev B, Valkadinov I. Videofluoroscopic follow up of the neohypopharynx in laryngectomized patients after radiotherapy. Estrel Congress Center Berlin; 2019 [cited 2020 Dec 10]. p. s-0039-1686079. Available from: http://www.thieme-connect.de/DOI/DOI?10.1055/s-0039-1686079
29. Bennett S, Weinberg B. Acceptability ratings of normal, esophageal, and artificial larynx speech. J Speech Hear Res. 1973;16:608–15.
30. Williams SE, Watson JB. Speaking proficiency variations according to method of alaryngeal voicing. The Laryngoscope. 1987;97:737–9.
31. Hillman RE, Walsh MJ, Wolf GT, Fisher SG, Hong WK. Functional outcomes following treatment for advanced laryngeal cancer. Part I--Voice preservation in advanced laryngeal cancer. Part II--Laryngectomy rehabilitation: the state of the art in the VA System. Research Speech-Language Pathologists. Department of Veterans Affairs Laryngeal Cancer Study Group. Ann Otol Rhinol Laryngol Suppl. 1998;172:1–27.
32. Ahmadi F, Noorian F, Novakovic D, van Schaik A. A pneumatic Bionic Voice prosthesis—Pre-clinical trials of controlling the voice onset and offset. Baumert M, editor. PLOS ONE. 2018;13:e0192257.
33. Econ ME, Soriano RG. PHONETOVOX: A Novel Prototype Device for Alaryngeal Speech. Philipp J Otolaryngol-Head Neck Surg. 2018;33:48–52.
34. Wand M, Koutnik J, Schmidhuber J. Lipreading with long short-term memory. 2016 IEEE Int Conf Acoust Speech Signal Process ICASSP [Internet]. Shanghai: IEEE; 2016 [cited 2020 Dec 9]. p. 6115–9. Available from: http://ieeexplore.ieee.org/document/7472852/
35. Hueber T, Benaroya E-L, Chollet G, Denby B, Dreyfus G, Stone M. Development of a silent speech interface driven by ultrasound and optical images of the tongue and lips. Speech Commun. 2010;52:288–300.
36. Schönle PW, Gräbe K, Wenig P, Höhne J, Schrader J, Conrad B. Electromagnetic articulography: use of alternating magnetic fields for tracking movements of multiple points inside and outside the vocal tract. Brain Lang. 1987;31:26–35.
37. Bocquelet F, Hueber T, Girin L, Savariaux C, Yvert B. Real-Time Control of an Articulatory-Based Speech Synthesizer for Brain Computer Interfaces. PLoS Comput Biol. 2016;12:e1005119.
38. Diener L, Janke M, Schultz T. Direct conversion from facial myoelectric signals to speech using Deep Neural Networks. 2015 Int Jt Conf Neural Netw IJCNN [Internet]. Killarney, Ireland: IEEE; 2015 [cited 2020 Dec 9]. p. 1–7. Available from: http://ieeexplore.ieee.org/document/7280404/
39. Janke M, Diener L. EMG-to-Speech: Direct Generation of Speech From Facial Electromyographic Signals. IEEEACM Trans Audio Speech Lang Process. 2017;25:2375–85.
40. Gonzalez-Lopez JA, Gomez-Alanis A, Martin Donas JM, Perez-Cordoba JL, Gomez AM. Silent Speech Interfaces for Speech Restoration: A Review. IEEE Access. 2020;8:177995–8021.
41. Anumanchipalli GK, Chartier J, Chang EF. Speech synthesis from neural decoding of spoken sentences. Nature. 2019;568:493–8.
42. Herff C, Heger D, de Pesters A, Telaar D, Brunner P, Schalk G, et al. Brain-to-text: decoding spoken phrases from phone representations in the brain. Front Neurosci. 2015;9:217.
43. Dash D, Ferrari P, Wang J. Decoding Imagined and Spoken Phrases From Non-invasive Neural (MEG) Signals. Front Neurosci. 2020;14:290.