Just powered the new grammatical engine

Just powered the new grammatical engine: it seems to allow for some interesting things, notably related to expressions. The case at hand is the French expression “parler comme un moulin”  (talk the leg off a chair) that translates into Corsican as dì quant’è sette. To be continued…

Posted in blog | Tagged | Comments Off on Just powered the new grammatical engine

Is rule-based MT more ethical than statistical MT?

In the ongoing debate on safe IA, it is a relevant open question of whether rule-based MT is more ethical than statistical MT. Here are some arguments in favor of rule-based MT in this context (without blaming statistical MT which has its own strengths):

  • it emulates human reasoning: it translates a text just as a human would do
  • there is much control on rule-based MT since the resulting translated text can be traced back: a detailed step-by-step translation process can be provided if required
  • rule-based MT can be consistently part of and integrate itself into a whole project of brain emulation, which emulates general human reasoning

 

Posted in blog | Tagged , , , , , | Comments Off on Is rule-based MT more ethical than statistical MT?

Open test – october 18 , 2018

Performing now an open test (now fully ‘open’ since it can be verified via http://okchakko.com/translate), from the 100 first words of the daily article of French wikipedia. There is one full sentence, but some remaining errors:

  • dopu à quattordici anni
  • brama di crià: the translation of French verb “souhaiter” is ambiguous, since it can mean either augurà (to wish), or bramà (to hope for), depending on the context
  • induv’eddu figura

Scoring: 1 – (7/105) = 93,33%.

Posted in blog | Leave a comment

A specific kind of superlative

Let us consider a specific kind of superlative. Such form specific to Corsican language is notably mentioned by grammarian and author Santu Casta, in his  Punteghju, who recommends the following translation of “C’était le village le plus riche du canton” (It was the richest village of the canton):  Era u più paese riccu di stu cantone (pages 26 & 54-55). The structure is original in the sense that the comparative (più) precedes the noun (campanile, bell tower) that precedes the adjective (altu, high).

Posted in blog | Tagged , , , , , , | Leave a comment

Vocative in Corsican language

Si tratta quì di u vucativu. Ùn ci hè traduzioni in lingua corsa senza traduzioni di u vucativu. Dunqua si facini quì i prima passi.

Chì ni manca sempri bon’ parechji: “o sgiò curà”, “o sgiò duttò”, “o amicu”, “o cumpà”, è cetara è cetara.

Posted in blog | Tagged , | Leave a comment

Picculu migliuramentu: u verbu “chjamà”

Here is the little progress of the day, which concerns the verb “chjamà” (to call). Preposition ‘à’ need to be added when the verb “chjamà” is followed by a person name. This is little improvement, but small streams make big rivers …

Posted in blog | Leave a comment

Spiccanza

File:Magdeburg hemispheres-CnAM 8075-IMG 6605.JPGCi sarani avà dui blogghi spiccati annantu à twitter: unu (Okchakko traduttori) par u filu di bloggu in corsu riguardu à a traduzioni automatica è a lingua corsa. È quidd’altru (Okchakko translator) in inglesu rispettu à l’intellighjenza articifiali è i lingui minacciati di sparizioni.

Posted in blog | Comments Off on Spiccanza

Homograph words in Corsican language

Eccu quì uni pochi di paroli umografi in lingua corsa (par avà si tratta di a varianti taravesa). I paroli umografi sò chì t’ani listessa prununcia ma una scrivitura diffarenti. Par cumincià, i veri paroli umografi:

  • a (articulu definitu feminicciu), à (pripusizioni) è (cunghjucazioni di u verbu avè)
  • Zilia (u paesi) è ziglia

Si pò allargà dopu u cuncettu d’umugrafia, senza fà a diffarenza trà l’o apartu o chjusu è l’e apartu o chjusu:

  • è (cunghjunzioni), (cunghjucazioni di u verbu essa) è e (articulu definitu, in corsu cismuntincu)

Allarghendu dinò à i doppii cunsunanti (b = bb, d = dd, l = llm = mm, n = nn, p = ppr = rr, t = tt, è cetara), t’avemu avà una bedda manata di paroli umografi:

Mariana, Marianna
Rennu, Renu
abati, abbatti
ani, anni
approdu, aprodu
archeti, archetti
buscheti, buschetti
capeddi, cappeddi
capeddu, cappeddu
capi, cappi
capii, cappii
capiu, cappiu
cari, carri
carru, caru
coda, codda
coddi, codi
copia, coppia
copii, coppii
cora, corra
cori, corri
corti, corti
corru, coru
culoni, culonni
cumeta, cummetta
cumeti, cummetti
cuntata, cuntatta
cuntati, cuntatti
cuntattu, cuntatu
cuntrata, cuntratta
cuntrati, cuntratti
cuntrattu, cuntratu
custata, custatta
custati, custatti
custattu, custatu
dani, danni
diddicata, didicata
diddicati, didicati
diddicatu, didicatu
diti, ditti
dittu, ditu
doma, domma
domi, dommi
dota, dotta
doti, dotti
dottu, dotu
farani, farrani
faremu, farremu
fareti, farreti
farà, farrà
fata, fatta
fati, fatti
feti, fetti
figureti, figuretti
fola, folla
foli, folli
fora, forra
forru, foru
ghjaddi, ghjadi
inatta, innata
inatti, innati
inattu, innatu
lati, latti
mani, manni
moda, modda
moddi, modi
moddu, modu
mora, morra
mori, morri
muteti, muttetti
nari, narri
narru, naru
noti, notti
pani, panni
peddi, pedi
pena, penna
peni, penni
portu, portu
quatru, quattru
raporti, rapporti
raportu, rapportu
rena, renna
reni, renni
reta, retta
reti, retti
rota, rotta
roti, rotti
scapà, scappà
seda, sedda
seddi, sedi
seta, setta
seti, setti
soma, somma
somi, sommi
soni, sonni
sonnu, sonu
spada, spadda
spaddi, spadi
stampeti, stampetti
stima, stimma
stimi, stimmi
strati, stratti
strattu, stratu
suneti, sunetti
tagliani, taliani
tappeti, tappetti
toni, tonni
tonnu, tonu
tori, torri
torru, toru
turreti, turretti
videti, videtti
viuleti, viuletti
zuccheti, zucchetti

 

Posted in blog | Tagged , , | Comments Off on Homograph words in Corsican language