@Article{aev:2022-10.55753/aev.v37e54.193, title = {Os efeitos da raiva na identificação automatizada de locutores baseada em espectros de longo prazo}, author = {Ortega-Rodríguez, M. AND Solís-Sánchez, H. AND Valverde-Méndez, D. AND Venegas-Li, A.}, journal = {Acústica e Vibrações}, year = {2022}, issn = {1983-442X, 2764-3611}, month = {dezembro}, number = {54}, pages = {43--51}, volume = {37}, doi = {10.55753/aev.v37e54.193}, publisher = {Sociedade Brasileira de Acústica}, keywords = {identificação forense de locutor e locutora, espectros a longo prazo, acústica forense, distorções emocionais, raiva}, abstract = {A identificação forense de locutores tem considerado tradicionalmente abordagens ao problema baseadas na análise de espectros a longo prazo (várias dezenas de segundos de duração). Essas abordagens demonstraram ser especialmente robustas, no sentido de que continuam funcionando bem mesmo se as gravações forem curtas; além disso, o método não é sensível a mudanças na intensidade sonora da amostra, e mantém um desempenho adequado na presença de ruído e largura de banda limitada. Por todos esses motivos, constitui uma das técnicas preferidas para a identificação forense, juntamente com a análise de formantes, velocidade da fala e determinação da frequência fundamental. No entanto, verificou-se que o estado de raiva produz uma distorção importante no sinal acústico para efeitos da análise de espectros de fala a longo prazo. Mesmo que o nível de raiva seja apenas moderado, há um desvio dos resultados quantitativos da identificação forense de locutores que representa 33\% da distância em direção a um locutor totalmente diferente (no espaço de correlação entre amostras). Portanto, conclui-se que é importante ter cautela ao aplicar este método. || Title: The effects of anger on automated long-term-spectra based speaker-identification || Abstract: Forensic speaker identification has traditionally considered approaches based on long-term (a few tens of seconds) spectra analysis as especially robust. This is because they work well for short recordings, are not sensitive to changes in the intensity of the sample, and continue to function in the presence of noise and limited passband. Because of this, the long-term spectra approach is one of the preferred tools for forensic speaker identification, in addition to formant analysis, speed of speech, and determination of the fundamental frequency. However, we find that anger induces a significant distortion of the acoustic signal for long-term spectra analysis purposes. Even moderate anger offsets speaker identification results by 33\% in the direction of a different speaker altogether (in the space of sample correlations). Therefore, caution should be exercised when applying this tool.}, }