• japan
  • english
  • indonesia
  • korean
  • china
  • china
  • vietnamese
  • deutsch
  • russian
  • thailand
  • polski
  • spanish
  • swedish
  • swedish
  • italian
  • french

Textuppläsning
mer infromation

Angående stöd för ljuduppspelning

Suzuki-kun kan nu läsa upp text och vi har förberett flera exempelmeningar. Försök att lyssna med "Uppskattning av Frasuppdelning" inställd på "maskininlärning" och därefter till "Bunsetsu". På sidan nedan visas tonhöjdskontur tillsammans med accentmarkeringar för elever på avancerad nivå. (Detta kommer inte att ändras även om du byter till nybörjarnivå). Hiragana som inte ska betonas visas med en fylld bakgrund.

Exempeltext 1 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 2 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 3 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 4 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 5 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 6 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 7 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 8 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 9 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 10 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 11 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')
Exempeltext 12 (frasuppdelning = maskininlärning/frasuppdelning = 'bunsetsu')

Om uppskattning av frasuppdelning (maskininlärning / 'Bunsetsu)

Detta förklaras i OJAD workshop. En ord-sträng med en accent-reglerning (börjar med LH, fortsätter på H, faller med HL, sedan fortsätta på L) kallas för en accent-fras. Beroende på stilen man pratar kan accent-frasen bli längre eller kortare.

"Uppskattning av Frasuppdelningar baserat på Maskininlärning" förutsäger var gränsen för accent-frasen bör ligga och grundas på flera tusen meningar som har fått sina frasuppdelningar markerade, förutsatt att meningen läses naturligt. I det här fallet förutspås lämpliga accent-fraser för en inskriven mening. I det här läget finns det ibland fel i förutsägelsen av accent kärnan eller gränsen. Å andra sidan, accent fras = 'Bunsetsu "erbjuder ett läge som kommer att se varje" bunsestu" som en accent-fras. Även om det här läget resulterar i färre fel, maximerar det antal accent fraser, vilket kanske inte alltid är önskvärt.

I båda lägena är det möjligt att ansluta accentfraser i en accent fras med "Tonhöjdsmönster= Nybörjarnivå" och "Accent = Nybörjarnivå ". Men om det finns en "accent typ 1" ord med mer än tre moror, lämnas accenten i befintligt skick. Som en allmän regel, om du ansluter accentfraser, blir det inga fel. Som en följd av detta kommer det inte att göra mycket av en skillnad i nybörjarläge huruvida frasgränsen bestäms av maskininlärning eller 'bunsetsu'.

För naturligt klingande tal, rekommenderar vi föregående läge. För de som vill lära sig alla böjningar och sammansatta ord med rätt accent rekommenderar vi den senare versionen.

Exempel som visar skillnaden mellan lägena "maskininlärning" och "bunsetsu ". (Frasuppdelning = 'maskininlärning')
Exempel som visar skillnaden mellan lägena "maskininlärning" och "bunsetsu ". (Frasuppdelning = 'Bunsetsu')

Om inställning av talare och hastighet på uppläsning

Suzuki-kun ger möjlighet att ställa in talre och talhastighet. Under syntes körs "Standard talare" och "Normal talhastighet". Under uppläsning är det möjligt att ändra talaren och talhastighet halvvägs igenom.

Det vill säga, det är möjligt att ändra talaren eller talhastighet med ett kommando. Kommandon som börjar med "//".

// [Talare]
// [Talhastighet]
// [Talare]     [Talhastighet]

är tillåtna.

// [Talhastighet]    [Talare]

är ej tillåtna. Nedan visas ett specifikt exempel.

// M2

Ändra högtalare till M2.
//S

Ändra talhastighet till S (långsam) .

// F2 F

Ändra talare till F2 och talhastighet till F (snabb). Systemet skiljer inte mellan versaler och gemener, halv bredd och fullbreddstecken.

[Speaker] = F1, F2, M1, eller M2
[Talhastighet] = F , N, eller S (snabb, normal, långsam)

Exempelkonveration mellan lärare och elev (Frasuppdelning = maskininlärning)
Exempelkonveration mellan lärare och elev (Frasuppdelning = 'bunsetsu')

Suzuki-kuns svagheter

Vi arbetar med att förbättra Suzuki-kun varje dag, men han har fortfarande vissa brister.

1. Om fel vid förutsägelse av accent-typ

1-1) Om uttryck som skrivs i hiragana

Om texten är skriven i hiragana, blir det svårt att upptäcka ordgränser och att identifiera ord på grund av homonymer (ord med samma uttal). På grund av detta är det möjligt Suzuki-kun inte kommer att känna igen ordet som det ordet du matar in.

Exempel på skillnader i förutsägelse för hiragana och kanji (Frasuppdelning = maskininlärning)
Exempel på skillnader i förutsägelse för hiragana och kanji (Frasuppdelning = 'bunsetsu')

1-2) Om uttryck som skrivs med kanji

Även när kanji används finns det ibland problem med att förutsäga frasuppdelning och accent-kärnans position. Detta problem uppstår i synnerhet med sammansatta substantiv.

Exempel på fel som uppstår när du använder både kanji och hiragana (Frasuppdelning = maskininlärning)
Exempel på fel som uppstår när du använder både kanji och hiragana (Frasuppdelning = 'bunsetsu')

1-3) Accent för okända ord

I det fall då Suzuki-kuns morfologiska analys resulterar i ett ord okänd för Suzuki-kun, förutspås tonviktskärnan efter följande accent-läges regler. Det finns dock vissa fall där du kan önska dig ett ord som skall uppfattas som okända, som exempelvis namnet på en internationell student, men det är inte definerat som sådant.

Exempel på korrekta och felaktiga morfologiska analyser (Frasuppdelning = maskininlärning)
Exempel på korrekta och felaktiga morfologiska analyser (Frasuppdelning = 'bunsetsu')

2. Om fel vid förutsägelse av läsning

2-1) Förändringar i läsning beroende på kontext

Suzuki-kun kommer ibland att läsa fel när det finns variationer beroende på sammanhang. Detta är inte på grund av svårigheter med att skilja mellan "onyomi" och "kunyomi". Det är oftast när det finns flera "kunyomi"-läsningar. Det är möjligt att ändra prognoser gjorda för accent-kärnor, men vi har inget möjlighet att redigera läsningen. I dessa fall är det bäst att skriva in ordet i hiragana.

Exempel med flera kunyomi (Frasuppdelning = maskininlärning)
Exempel med flera kunyomi (Frasuppdelning = 'bunsetsu')

2-2) Siffror och räkneord

Med den nya Suzuki-kun, har det blivit möjligt att läsa en mängd olika ord relaterade till siffror. Samma sak med symbolerna #$%&=~@.+〒¥£. När en siffra följs av ett räkneord (siffra + räkneord), finns det ibland fel i läsningen. Räkneord är ett typiskt exempel på ett ord där läsning och brytning beror på sammanhanget. 一 本, 二 本, 三 本 · · · 一日, 二 日, 三 日 ... Läsningen för siffror + räkneord hanteras med efterbearbetning, men prestandan är fortfarande otillräcklig.

Exempel med en mängd olika symboler och numeriska fraser (Misslyckade fall ingår också. Frasuppdelning = maskininlärning)
Exempel med en mängd olika symboler och numeriska fraser (Misslyckade fall ingår också. Frasuppdelning = 'bunsetsu')

3. Om kontroll av tvetydighet i betydelse och intonation

木のしたで雨宿りをしている女性を眺めた。
木のしたで,雨宿りをしている女性を眺めた。
木のしたで雨宿りをしている女性を,眺めた。

Beroende på vad "木のしたで" beror på, kan intonation variera något. Detta betyder inte att Suzuki-kun har funderat på vad varje fras beror på när han fattar bestämmer intonationen. För att simulera detta är det viktigt att tillhandahålla lämpliga skiljetecken.

雨宿り exempel (Frasuppdelning = maskininlärning)
雨宿り exempel (Frasuppdelning = 'bunsetsu')

きれいじゃない。

Detta innebär inte bara de fall där du är imponerad av något きれい, utan det kan också innebära att du vill betona att något är inte きれい. Det som skiljer dem är intonationen. Suzuki-kun kan inte avgöra vilken av de två som betydelsen bygger på i sammanhanget. Varje mening kommer att behandlas som om det är isolerat. Det rekommenderas inte att du försöker använda Suzuki-kun för en sådan hög nivå. Tänk på vad som är möjligt att göra. (Det är möjligt att göra ändringar med tonhöjdsredigeraren).

きれいじゃない例 (Frasuppdelning = maskininlärning)
きれいじゃない例 (Frasuppdelning = 'bunsetsu')