La voz diptongo procede del latín ‘diphthong

Las vocales se bastan ellas para formar sílabas ya que las consonantes, por definición, sólo pueden ‘sonar con’… (las vocales). Cuando dos vocales seguidas se articulan en un solo impulso como si fuesen una sola forman un diptongo (i.e. viento, pueden) pero si cada una se pronuncia sin unirse con la otra habrá entonces ‘hiato’ (i.e. pa-ís, prove-er). En el diptongo, una de las vocales es abierta y larga mientras que la otra es cerrada y breve. A la vocal mermada se le llama ‘semivocal’ cuando sigue a la vocal principal o ‘semiconsonante’ cuando la precede. Habrá ‘triptongo’ si son tres como en ‘buey’ las vocales asociadas.

¿Qué es un diptongo?

Una cadena sonora que consiste en la articulación de dos vocales, una a continuación de la otra, sin interrupción y produciéndose una transición suave en las frecuencias sonoras que caracterizan los timbres de cada una de las dos vocales. Fonológicamente dos vocales articuladas de esa manera forman parte de la misma sílaba.

En un diptongo los formantes acústicos tienen una transición suave desde un punto del área vocálica a otro, lo que les da su naturaleza de diptongos. Esto corresponde a una articulación en que la lengua se mueve entre distintos puntos durante la emisión del diptongo. Los dos puntos extremos de la articulación son percibidos como las dos vocales que forman el diptongo. En el espectrograma de un hiato no se observa la zona de transición, razón por la que fonéticamente son diferentes.

Si bien la mayor parte de las lenguas del mundo tienen en su repertorio diptongos fonéticos, existen algunas lenguas que carecen por completo de diptongos. La calidad de las vocales que pueden formar diptongo varía de una lengua a otra.

Un hiato es en cierto modo lo opuesto a un diptongo, ya que es un contacto de dos vocoides (sonidos de tipo vocálico) que no forman sílaba; es decir, es la pronunciación separada de dos vocales, en que cada vocal pertenece a una sílaba distinta.

Una vocal compleja, o sea una combinación de dos o más vocales funcionando en la parte central (o núcleo) de una sílaba. En general una vocal alta  se combina con una no alta (media o baja), y la no alta se pronuncia más fuertemente que la alta. La vocal pronunciada menos fuerte suele escribirse volada en la transcripción fonética. (A veces esta vocal se analiza como una semiconsonante, en vez de ser parte de un diptongo.) Las combinaciones ueie y au del español (p.ej. en «puedo«, «piedra«, y «pauta«) pueden analizarse como los diptongos [ue], [ie] y [au]

Fuentes:

Etimologías de Chile. Ver en Sitio Original. Wikipedia. Ver en Sitio Original.
Tuggy T., David y J. Albert Bickford, 2002. Glosario eElectrónico. Instituto Lingüístico de Verano (México). [abril 2002]