Reglas de Transcripcion Fonetica PDF
Reglas de Transcripcion Fonetica PDF
Reglas de Transcripcion Fonetica PDF
Resumen:
1. Objetivos:
2. Introduccin:
3. Desarrollo:
Las reglas tienen que ser tan especficas como para poder captar las propiedades
que cada uno de los sonidos adopte en la conversacin cotidiana, ya que las
reglas deben orientarse ms que al desarrollo de una teora especfica, a su
adecuacin con las caractersticas del sistema de reconocimiento. Esto quiere
decir que las reglas deben dar como resultado la descripcin ms fiel posible de
las diversas maneras que un hablante tipo pronuncia una palabra, para que exista
el mayor grado de coincidencia con los fonemas que el reconocedor infiere a partir
de la seal acstica.
Las reglas fonticas pueden pensarse dentro del contexto de una gramtica
sensible al contexto, como tradicionalmente se realiz en la fonologa a partir del
libro de Chomsky y Halle, The sound pattern of English(1969). Este sent las
bases de la fonologa contempornea, sin embargo algunas de sus proposiciones
han sido superadas. Muchas aplicaciones en los campos de Natural Language
Understanding y Speech Technology han utilizado el formalismo de SPE por su
simplicidad y transparencia para la programacin. Una regla fonolgica tiene un
input o entrada y un output o salida. La flecha que une a ambas partes puede
leerse como se reescribe. As podemos tener la siguiente regla :
Esto significa que un smbolo cualquiera que sirve de entrada, se transcribe como
otro smbolo o salida, en determinado contexto, esto es entre el fonema que le
antecede y el fonema que le sigue. Todos los sonidos del habla se transforman de
acuerdo al sonido que le antecede y al que le sigue, ya que existen diferencias
cruciales entre el sonido producido en forma aislada y el sonido producido en
contexto. El hecho que un sonido pueda predecirse por su contexto ha sido la
principal contribucin de la fonologa a las tecnologas del habla.
Las reglas no tomarn en cuenta los sonidos que varan significativamente segn
su contexto y que no estn contemplados en el alfabeto desarrollado por los
productos como Nuance, SpeechWorks o Phillips, o que tienen variaciones entre
su ortografa y su representacin fonmica. Por ejemplo : p, f, t, d, b. La
numeracin indica el orden de los reemplazos. Hay reglas que se aplican en el
contexto de la slaba, otras en el contexto de la palabra y por ltimo otras en el
contexto entre palabras.
Las reglas pueden incluir opciones, lo cual indica que un sonido puede
transcribirse de una u otra manera dependiendo de las condiciones del habla.
Para este caso se utilizar la siguiente convencin usual en la literatura :
XY|Z/_A
Hay reglas que son sensibles a la delimitacin silbica. Para esto se utiliz por
convencin sil (que indica slaba). Cuando se le agrega un guin ms un fonema,
por ejemplo, sil-d, significa que la d est al final de la slaba, lo que quiere decir
que est en posicin de coda silbica. La regla que incorpora la categora acento
son la 21 y 22, donde i y u se transforman en j y w en el contexto de un diptongo,
si i y u no estn acentuadas. Por ltimo se encuentran las reglas que toman
como contexto las palabras, por ejemplo la s al final de la palabra, que en
Regla 1:
Convierte todas las combinaciones de ch en tS. Por ejemplo, Chela en tSela.
Excepciones, los nombres extranjeros deben ser filtrados, antes de ingresar a la
conversin, para no ser traducidos por esta regla, por ejemplo para que apellidos
como Schwartzman no sean traducidos como StSwartzman.
Regla 2:
Remueve todas las h restantes, ya que estas no se pronuncian en espaol.
Regla 3:
Convierte todas las v en b.
Regla 4:
Indica que todas la n y antes de p y de b se transcriben tambin se
transcriben como m. Por ejemplo, enviar, por la regla 3 se convierte en enbiar y
por la regla 4 en enbiar y embiar. Generalmente no se encuentra la n antes de p,
pero cuando se aplican reglas entre palabras esto sucede a menudo. Por ejemplo,
San Pedro, se transforma en Sampedro.
Regla 5:
Convierte todas las m antes de r, s, etc, tambin en n. No aparecen palabras en
el idioma con estas combinaciones, pero son frecuentes en los apellidos no
hispnicos. Por ejemplo, Hamra, tambin se transcribe como Hanra.
Regla 6:
Convierte las n antes de f tambin en m. Por ejemplo, enfermedad, tambin
se transcribe como emfermedad.
Regla 7:
Las combinaciones ca, co y cu, se transcriben como ka, ko, ku. Por ejemplo, kasa,
kosa y kurioso.
Regla 8:
Todas las que y qui, se transcriben como ke y ki. Por ejemplo, Quesada como
kesada y quitar como kitar.
Regla 9:
Todas las slabas ce y ci, se transcriben como se, si, excepto en los apellidos
italianos o de origen extranjero. Por ejemplo, Cecilia, se transcribe como sesilia.
Regla 10:
Regla 11:
Las combinaciones ge y gi se transcriben como Ce y Ci. Por ejemplo, General se
escribe Ceneral y gitano como Citano. Muchos apellidos de origen italiano o
portugus por ejemplo, pueden transcribirse con el sonido S, que equivale a la ll
de llevar o a la y de yo. As podramos decir Sirola por Girola o Seneiro por
Geneiro como pronunciaciones alternativas. Esta opcin depende de la forma en
que pueda incorporarse este sonido.
Regla 12:
La combinacin cc se convierte en ks o en gs, como en acciones aksiones y
agsiones.
Regla 13:
Transformar todas las je "ji" en Ce "Ci". Por ejemplo cajero en k a C e r o.
Regla 14:
Transformar todas las ja, jo, ju en xa, xo, xu. Por ejemplo Juan por xuan.
Regla 15:
La en todos las casos se transcribe como J y nj. Por ejemplo, nio se transcribe
como niJo y ninjo.
Regla 16:
Convierte gue y gui en ge y gi. Por ejemplo, Guerrero en gerrero y Guilln en
gilln.
Regla 17:
Convierte r entre n y vocal y l y vocal en rr. Por ejemplo, alrededor en
alrrededor, enrique en enrrique.
Regla 18:
Convierte todas r entre dos vocales en r. Por ejemplo, Ara en ara. (Esta regla
es expletiva en el Sampa, sirve para otros sistemas).
Regla 19:
Regla 20:
Convierte la r que est en el contexto de br-VOCAL, dr-VOCAL, gr-VOCAL, pr-
VOCAL, tr-VOCAL, kr-VOCAL, fr-VOCAL en brvocal, prvocal, etc. Por ejemplo,
Brasil se transforma en b!asil, Prada en p!ada, etc. . (Esta regla es expletiva en el
Sampa, sirve para otros sistemas).
Regla 21:
La regla 19 convierte las r en rr al principio de palabra. Por ejemplo, Rodriguez
en rrodriguez.
Regla 22:
Convierte rr en rr. Expletiva en el sistema Sampa.
Regla 23:
Convierte la i en j si la i est precedida o le sigue una vocal abierta, -a , o , u-
y si i es no acentuada. Por ejemplo, diario en djarjo, pero no en daz, que queda
como diaz. En inicio de palabra el Sampa estipula la utilizacin del smbolo "jj", es
decir la semiconsonante que es ms cerrada que la semivocal "j".
Regla 24:
Convierte la u en w si la u est precedida o le sigue una vocal abierta, -a , o ,
i- y si u es no acentuada. Por ejemplo en puede, se transforma en pwede, austero
en awstero, pero no en an, que queda aun.
Regla 25:
Convierte la "ll" en "S", en "Z" y en "dZ". Dicha regla depende de variaciones
sociolectales en la Argentina. S se utiliza puede encontrarse con ms frecuencia,
Z y dZ se utiliza como forma de distincin social o cultural en Buenos Aires. En
provincias argentinas suele darse tambin variadas formas ms hispnicas, como
por ejemplo en Cuyo y el Norte en general, como la "j", la "jj" y la "L". Por ejemplo,
lluvia se convierte en lluvia y en Suvia. En general, si se transcribe habla de
Buenos Aires, la forma usada es S.
Regla 26 :
Convierte la "y" al final de slaba en "j". Por ejemplo, en buey, se convierte en buej,
o Paraguay en paraguaj.
Regla 27 :
Convierte las restantes "y" en "S", en "Z" y en "dZ". Por ejemplo, yo se convierte
en So. Se aplica de igual forma que la regla 25.
Regla 28 :
Regla 29 :
Convierte la "s" antes de k y g, en "s" y en "x" (sonido de la jota espaola). Por
ejemplo, en bosque se transforma en boske, y luego en boxke y boske.
Regla 30 :
Transcribe las combinaciones gua y guo, como gwa, wa. Por ejemplo, en antiguo,
se transforma en antigwo y en antiwo.
Regla 31 :
Convierte los inicios en ua, uo y ue en wa, wo y we, y en gwa, gwo y gwe. Por
ejemplo, huerta, se convierte en werta y en gwerta.
Regla 32 :
Si "s" est al final de palabra, entonces se transcribe con "s" y sin "s". Por ejemplo,
tres, se transcribe como tres y como tre. Esta regla se sustenta en el hecho en que
las consonantes finales se debilitan o no se pronuncian directamente en algunos
registros, por lo cual es posible que en el proceso de reconocimiento no se
detecten.
Regla 33 :
Si "d" est al final de palabra, entonces se transcribe con "d" y sin "d". Por
ejemplo, ciudad se transcribe como ciudad y ciuda. La mismo argumento que en
31 se sustenta para la regla
Hay reglas que aplican entre palabras. Esto se da en aquellos casos en que una
frase compuesta de varias palabras puede ser considerada como una palabra en
trminos fonticos. Esta es la ley, ya que el habla es continua y los cortes
solamente se hacen en una pausa. La habilidad de un programa de
reconocimiento para segmentar la cadena del habla depende de cmo est
configurado el endpointing. En todo caso lo conveniente es poder predecir como
una frase puede ser dicha y segmentada en distintos grupos prosdicos para
transcribir todas las posibilidades.
Las posibles segmentaciones pueden ser (donde # indica pausa o cambio tonal):
Ignacio Orduna
Etc.
Si tenemos en cuenta los fonemas que inician y culminan cada palabra, podemos
darnos cuenta que estos constituyen nuevas slabas. As podemos encontrar que
con el se pronuncia k o n e l, y que nunca se hace una pausa, al menos que
haya una disfluencia por razones azarosas, como tos, risa, respiracin, olvido,
distraccin, etc, difciles de predecir. La dificultad estriba en que esto tambin
puede ocurrir en el medio de una palabra, y en el proceso de reconocimiento
pueden tomarse como dos.
,loxboxkes
,los
,boxkes
5.Si una palabra termina en vocal y la siguiente empieza con una vocal distinta,
entonces puede ocurrir que formen un diptongo, segn las reglas 21 y 22, o si
son dos vocales abiertas ( a, e, o) se conservan sus caractersticas, se
fusionan o se convierten en diptongo.
Albertualonso
Ro de La Plata - Riodlaplata
Ciudad La Plata ciudadlaplata o ciudalaplata
3.2.1. Concepto.
S= V, VV, VC, VCC, CV, CVV, CVVV, CCV, CCVV, CCVC, CCVCC, CCVVC, etc.
Ejemplos:
V a-bla-ban
VV hie-na
VC ac-tua-cin
VCC abs-trac-cin
CV ca-sa
CVV cue-va
CVVV buey
CCV Bra-vo
CCVV prue-ba
CCVC fren-te
CCVCC trans-por-te
CCVVC cruel-dad
a.Una slaba debe contener al menos una vocal, la cual se convierte en el nico
elemento imprescindible.
b.La slaba no puede contener ms de cinco fonemas.
donde
? indica opcionalidad
?? indica mayor grado de opcionalidad.
( X (Z) ) indica que la aparicin del elemento incrustado en un parntesis
doble (Z) depende de la aparicin del elemento con simple parntesis
(X).
De acuerdo al apartado anterior podemos considerar que las siguientes son las
reglas para la delimitacin silbica en espaol:
VCV V # CV
Apa a pa
2)Cuando dos consonantes se encuentran entre dos vocales, hay que tener en
cuenta:
2.a. Son inseparables los grupos que estn formados por las consonantes (b, p, f,
g, k, d,t) con las lquidas (r, l).
[pr, br, pl, bl, fr, fl, gr, gl, kr, kl, dr, tr]
2.b. Cualquier otra pareja de consonantes que se encuentre entre dos vocales,
queda dividida, de manera que la primera consonante cierra la slaba
inmediatamente anterior, y la segunda forma parte de la rama explosiva de la
slaba siguiente.
Ar-tis-ta, in-se-pa-ra-ble, cuen-ta.
Artista Ar tis ta
VCCVCCV VC#CVC#CV
3.b. Que las dos primeras formen un grupo constituido por nasal (n), ms fricativa
sorda (s). Cons-tru-ir, ins-tau-rar.
4)El contacto entre dos vocales abiertas (a, e, o) da origen a dos slabas:
5)Si se renen dos slabas una abierta (a,e,o), otra cerrada (i, u) o dos cerradas
(i,u), forman diptongo. A menos que el acento est en la cerrada, es decir que
el diptongo se rompe, forman una sola slaba. Bue-no, eu-ro-pa, a-sia.
Existe a su vez una dificultad para transcribir con el set de fonemas del espaol
latinoamericano lenguas como ingls, para la cual no existen smbolos ni modelos
acsticos correspondientes. Por ejemplo, es comn en las empresas, tener
departamentos tales como: information technology, administration, customer, call
center, recovery credits, help desk, etc. Cuando esto es un hecho comn, una
posibilidad es combinar distintos packages.
4.2. Nmeros:
2.Los nmeros terminados con s, dos, tres y seis, tienen tres alternativas, 1) no
se pronuncia la s, 2) se debilita, por lo tanto tiene poca energa y es posible
que el reconocedor no la tome como tal, y 3) se pronuncia. as podemos tener:
seismil y seimil (ms frecuente).
Tresmil#novecientos#ochentai#ocho
Tresmilnovecientos#ochentaiocho
Tresmil#novecientosochochentaiocho
Tresmil#novecientos#ochentaiocho.
4.Recordar que la forma para transcribirlos juntos ayuda a detectar las posibles
pronunciaciones. Por ejemplo, si uno dice: trecientos cuarenta, la ltima s de
trescientos puede transcribirse adecuadamente como s y x segn una regla,
y como s o delete por otra, en tanto que si se codifican en el diccionario por
separado se pierde la posibilidad de transcribirlos con mayor precisin.
5.Los nmeros hay que transcribirlos en singular y plural, cuando existe esta
variante y en femenino y masculino. Por ejemplo, quinientos y quinientas, un y
unos, etc, puesto que puede tratarse de valores, acciones, fechas, nmeros de
telfono, etc, que cada uno tiene estas variantes.
i
Las consonantes se clasifican bsicamente por dos parmetros articulatorios, estos son el punto y el modo de
articulacin. El punto de articulacin indica el lugar donde se produce el mayor grado de constriccin dentro
del tracto vocal. As tenemos las labiales, cuyo punto de articulacin son los labios, como b, p y m, las
dentales, cuya constriccin se produce entre la lengua y los incisivos superiores, como por ejemplo, t y d,
las alveolares, entre la lengua y los alvolos, como l y n, las velares, entre el cuerpo de la lengua y el velo
del paladar, como por ejemplo k y g. El modo corresponde a la naturaleza o grado de estrechamiento.
De acuerdo a este parmetro tenemos, las oclusivas o stops, en las cuales el cierre es completo, por
ejemplo, p, t, k, g, d, b ; las fricativas, en las cuales hay un estrechamiento pronuciado entre los articuladores
producindose una diferencia de presin y velocidad del aire en el lugar de estrechamiento cuyo correlato
acstico es el ruido de fricacin, como en la f, s y x (j en la ortografa), o vibrantes, que se producen
cuando un articulador vibra ante el paso de la corriente de aire, como el pice de la lengua en r y rr,
laterales, en las cuales la corriente de aire pasa por ambos lados de la lengua, por ejemplo en la l. Esta lista
no es exhaustiva, y solamente es a modo de ejemplificacin.