Pasar al contenido principal
Autor/a:
Dra. Elena Mora Rivas
ISBN:
978-84-09-18814-7

1. La historia clínica debe recoger: 

  • La exposición libre por parte del paciente sobre lo que le ocurre a su voz
  • Una anamnesis dirigida respecto a la cronología de los síntomas, cambios de la voz a lo largo del día, posible relación con algún factor, síntomas alérgicos, síntomas digestivos (sobre todo relacionados con el reflujo faringolaringoesofágico), toma de medicaciones (antihistamínicos, diuréticos, antidepresivos), mal uso y abuso vocal y actividad laboral (voz profesional)
  • Un test de autovaloración que explore los aspectos funcional, emocional y físico de la alteración vocal. La versión abreviada del Indice de Incapacidad Vocal (Voice Handicap index, VHI-10)  es el más usado actualmente. Consta de 10 items y cada ítem se puntúa de 0-4 puntos, y cuánto más alta es la puntuación, mayor se considera la afectación que el paciente tiene en su vida por su problema de voz. 

2. La exploración física consta de una parte instrumental y de la valoración perceptual y psicoacústica de la voz. La exploración instrumental y de laboratorio incluye la visualización de la laringe con luz continua y con luz estroboscópica , el perfil de rango vocal o fonetograma y el análisis acústico digital de la voz. 

2.1. La valoración perceptual se estudia con:

  • La escala GRABS, acrónimo en inglés, hace referencia al grado general de disfonía (G), al grado de rugosidad o ronquera (R) (típica de nódulos, por ejemplo), al grado de astenia o debilidad (A) (típica de enfermedades neurológicas como el parkinson), al grado de voz aérea (B)(típica de parálisis laríngeas), y al grado de tensión (S) (típica de disfonía por tensión muscular). Cada ítem se puntúa de 0 a 3 puntos. La escala GRABS pretende atribuir por parte del examinador unas cualidades a la voz, que le permitan relacionarlas con la patología y el grado de la lesión y evaluar la evolución tras el tratamiento. Así, los atributos R y B se asocian más a lesiones orgánicas, mientras que los atributos A y S se asocian más a la patología funcional. 
  • El cociente fonorrespiratorio o índice s/e es el cociente entre los tiempos máximos de fonación (TMF) para la /s/ y para la /e/. El TMF se obtiene solicitando al paciente que diga la letra correspondiente todo el tiempo que le sea posible tras una inspiración profunda. Este índice relaciona la función pulmonar (la /s/) con la laríngea (la /e) (cierre glótico), y en condiciones normales es ≤ 1,3; cuanto más alto sea nos indica que el grado de cierre de las cuerdas vocales es menor. 

2.2. La visualización de la laringe puede realizarse mediante telelaringoscopia (óptica rígida de 70 o 90º que permite la obtención de una imagen de las cuerdas vocales a gran escala y estable) o mediante nasofibroscopia (óptica flexible actualmente con la cámara o chip en la punta que permite la obtención de una imagen no centrada en las cuerdas vocales sino de toda la laringe en funcionamiento en fonación o durante el canto por ejemplo). Ambos métodos de exploración se pueden realizar con luz continua y con luz estroboscópica.

La luz estroboscópica reduce de forma virtual la frecuencia fundamental de la vibración vocal, es decir, el número de veces que las cuerdas vocales vibran por segundo, para que el ojo humano sea capaz de visualizar dicha vibración. Con la estroboscopia se pueden valorar los principales parámetros orgánicos de una disfonía: 

  • Onda mucosa: su presencia nos habla de la integridad de la lámina de la propia de la cuerda vocal. Puede ser normal, estar reducida o aumentada. 
  • Defecto de cierre glótico, que puede ser de seis tipos: posterior (normal en la mujer joven si es mínimo, típico de fonastenia en profesionales de la voz con fatiga vocal); anterior; en reloj de arena (típico de los nódulos vocales); anterior y posterior; irregular; en huso (típico de la atrofia vocal); y completo. 
  • Periodicidad: es decir, hay regularidad de las sucesivas vibraciones de las cuerdas vocales. 
  • Simetría entre una cuerda y otra. 

La laringoscopia de alta velocidad (high speed imaging), desarrollada gracias a la aparición de las cámaras de grabación de alta velocidad, que permiten capturar imágenes a muy alta velocidad y observar en tiempo real todos los fenómenos que ocurren durante el ciclo vocal. Una de sus principales ventajas respecto a la estroboscopia es que puede analizar la vibración aun cuando ésta no sea periódica, o no haya cierre completo de las cuerdas, etc. Pueden obtenerse imágenes de lo que ocurre en una línea seleccionada y transversal a las cuerdas vocales, mostrando el patrón vibratorio de ese punto justo (videoquimografía) o la totalidad de las imágenes en tiempo real. Puede analizarse el diferente comportamiento vibratorio de diferentes partes de la cuerda vocal en un mismo paciente. La laringoscopia de alta velocidad es capaz incluso de evaluar la vibración por estructuras diferentes a las cuerdas vocales (bandas ventriculares, neoglotis en caso de laringuectomías totales o parciales). 

2.3. El perfil de rango vocal o fonetograma permite una cuantificación funcional y representa en un eje de coordenadas la intensidad de la emisión vocal mínima y máxima junto a las frecuencias mínima y máxima que alcanza el paciente. La diferencia entre las notas (frecuencia) máxima y mínima emitidas es el rango vocal, mientras que el rango dinámico es la diferencia entre la intensidad máxima y mínima emitidas. Puede realizarse de forma manual o informatizada. 

2.4. El análisis acústico digital (descomposición de una onda compleja y periódica como es la voz mediante el teorema de Fourier) permite analizar los componentes fundamentales de la onda sonora de la voz, es decir la frecuencia fundamental (el componente de menor frecuencia y mayor intensidad) y los armónicos (resto de los componentes de la onda sonora, que aumentan en frecuencia y disminuyen en intensidad). Estos componentes nos dan información sobre los fenómenos que forman la voz y que tienen lugar en la laringe y a lo largo del tracto vocal (faringe, dorso de la lengua y labios) y que determinan el timbre vocal, lo que define cada voz. En el análisis acústico digital se utilizan tres tipos de señales: -Micrófonica: se registra con un micrófono situado a unos 20 cms de la boca, y corresponde al sonido emitido desde los labios. La representación de la señal microfónica adopta dos formas: 

  1. Forma de onda: representa la variación de la intensidad de la señal en función del tiempo. 
  2. Espectrograma: representa la variación en la frecuencia de la señal en función del tiempo. Es la que más información aporta porque descompone la onda en sus componentes básicos: la frecuencia fundamental, los armónicos, la intensidad de cada componente; los formantes o zonas de agrupación de los armónicos, zonas de refuerzo de la señal glótica a lo largo del tracto vocal, y el ruido asociado a la señal vocal. 

  • Electroglotográfica: se registra entre dos electrodos situados a ambos lados del cartílago tiroides y permite calcular la frecuencia fundamental. 
  • Filtrado inverso: corresponde a la señal del propio ciclo glótico y se obtiene mediante la aplicación de filtros en la señal vocal. 

Los parámetros que se estudian en el análisis acústico digital son: 

  • Frecuencia: número de veces que vibran las cuerdas vocales en un segundo. Se mide en ciclos por segundo o Hz. A mayor frecuencia el tono de la voz es más agudo. 
  • Jitter o perturbación de la frecuencia: que mide la estabilidad de la fonación al calcular la variación de la duración entre un ciclo vocal y el anterior. A mayor valor, más disfonía. 
  • Intensidad: presión de la señal vocal, que se mide en dB y que varía entre 35 y 105 dB. 
  • Shimmer o perturbación de la intensidad 
  • Relación armónico-ruido (HNR): a menor valor, mayor disfonía. 

2.5. Electromiografía laríngea: analiza la actividad eléctrica de un músculo concreto mediante la colocación de un electrodo de aguja en las fibras musculares en distintas situaciones: actividad espontánea en reposo, actividad voluntaria y máximo esfuerzo. El patrón normal de activación presenta un reclutamiento denso, la presencia de potenciales polifásicos nos habla de reinervación y la presencia de actividad espontánea de denervación. Es interesante realizarla para: 

  • Diferenciar inmovilidad de parálisis de las cuerdas vocales. 
  • Determinar la naturaleza de la lesión nerviosa, si es axonal, desmielinizante o mixta .
  • Determinar el pronóstico de una paresia o parálisis, si existe actividad espontánea el pronóstico es malo, si existen potenciales polifásicos de reinervación el pronóstico será mejor.
  • Estudio de temblor y distonías laríngeas .
  • Localizar un músculo concreto, por ejemplo para la infiltración de toxina botulínica en el caso de disfonía espasmódica u otros problemas. 

Se realizará sobre diferentes músculos en función de la patología que estemos estudiando o tratando, por ejemplo para la disfonía espasmódica adductora se buscará el músculo tiroaritenoideo, para la abductora el cricoaritenoideo posterior; para la acalasia el músculo cricofaríngeo, para la posible lesión de la rama externa del nervio laríngeo superior el músculo cricotiroideo, etc. Habitualmente se realiza mediante punción percutánea en la consulta.

  • Cobeta I, Núñez F, Fernández S. Patología de la voz. Ponencia oficial de la Sociedad Española de Otorrinolaringología y Patología Cérvico-Facial. Barcelona: Marge Médica Books; 2013.
  • Rubin JS, Sataloff RT, Korovin GS. Diagnosis and treatment of Voice Disorders. Plural Publishing 2014.
Estado del artículo:
Publicado