სიახლეებზე დაბრუნება
16 Feb, 2026

მართლმწერი | Georgian Spell Checker

მართლმწერი | Georgian Spell Checker

"სტატისტიკური ლექსიკონი" და მართლმწერი

"სტატისტიკური ლექსიკონი", რომელიც ითვლის, თუ რომელი სიტყვა უფრო ხშირად დგას სხვა სიტყვის შემდეგ. ის არ „ფიქრობს“ და არ „ესმის“ ენის მნიშვნელობა, როგორც ამას თანამედროვე ნეირონული მოდელები (მაგალითად, GPT) ცდილობენ. ის უბრალოდ იმახსოვრებს სტატისტიკას.

🧐 როგორ მუშაობს

წარმოიდგინეთ, რომ მოდელს „ვასწავლეთ“ ქართული ენა მილიონობით წიგნის, სტატიისა და ვებსაიტის წაკითხვით. სწავლის პროცესში, ის ითვლიდა და იმახსოვრებდა, რომელი სიტყვების ჯგუფი (n-gram / ნ-გრამა) უფრო ხშირად გვხვდება.

  • "დიდი მადლობა დახმარებისთვის" — 5,000-ჯერ
  • "დიდი მადლობა მანქანისთვის" — 10-ჯერ
  • "დიდი მადლობა კატისთვის" — 0-ჯერ

ასე „იცის“ სისტემამ, რომ „დიდი მადლობა“-ს შემდეგ „დახმარებისთვის“ ბევრად უფრო მოსალოდნელია, ვიდრე „მანქანისთვის“.

🎯 როგორ ეხმარება ეს მართლწერის შემმოწმებელს?

ვთქვათ, თქვენ დაწერეთ: „დიდი მადლობა დახმრებისთვის“. მართლმწერი პოულობს შეცდომას („დახმრებისთვის“) და გთავაზობთ კანდიდატებს:

  • დახმარებისთვის
  • დამარცხებისთვის
  • დახატულისთვის

შემდეგ ამოწმებს, რომელი ფრაზაა ბუნებრივი:

  • "დიდი მადლობა დახმარებისთვის" — ძალიან ბუნებრივია.
  • "დიდი მადლობა დამარცხებისთვის" — იშვიათია.
  • "დიდი მადლობა დახატულისთვის" — არაბუნებრივია.

შედეგი: მართლმწერი ირჩევს „დახმარებისთვის“, რადგან ენობრივი მოდელის სტატისტიკით ეს არის ყველაზე ლოგიკური და ბუნებრივი გაგრძელება.