Pretiahni vzory pre úpravu poradia.
Študent
Ondrej Drengubiak
Vedúci
Ing. Viktor Matovič, PhD.
Rok
2025/2026
Študijný program
Informatika
Cieľom projektu je vytvoriť metódu pre analýzu textových opisov vzorov a generovanie sekvencií na základe protichodných síl medzi nimi. Aplikácia využíva pokročilé techniky spracovania prirodzeného jazyka na identifikáciu vzťahov medzi vzormi.
FIIT STU Bratislava | Ústav informatiky a softvérového inžinierstva | Verzia ---
Aplikácia analyzuje textové popisy vzorov pomocou metód TF (term frequency) a IDF (inverse document frequency). Môžete si vybrať medzi týmito metódami pomocou checkboxu IDF. Podobnosť sa počíta ako kosínusová podobnosť medzi vektormi slov jednotlivých vzorov.
TF (term frequency) dáva váhu všetkým slovám v texte, takže vzory sú prepojené na základe bežných slov. IDF (inverse document frequency) zvýrazňuje vzácne, špecifické slová a potláča bežné – výsledkom sú čistejšie, významovejšie vzťahy medzi vzormi.
Stop slová sú bežné slová (napr. 'a', 'the', 'and'), ktoré sa ignorujú pri analýze. Kliknutím na tlačidlo 🚫 vedľa parametrov môžete pridať vlastné stop slová, odstrániť existujúce alebo resetovať na predvolené. Každé slovo musí byť zadané samostatne.
Sekvencia sa generuje pomocou Markov Decision Process (MDP). Najprv sa vyberie vzor s najvyššou celkovou podobnosťou (cieľ). Potom algoritmus iteratívne vyberá ďalšie vzory na základe pravdepodobností prechodu, ktoré sú odvodené z matice podobností. Parametre γ, R(g), R(o) a ε ovplyvňujú správanie algoritmu.
Áno, po vygenerovaní sekvencie môžete vzory jednoducho pretiahnuť myšou a zmeniť ich poradie. Tlačidlo 🔄 vás vráti k pôvodnému poradiu, ak si to rozmyslíte.
V sekcii 'Navrhnutá sekvencia' kliknite na tlačidlo 'Exportovať (.txt)'. Vedľajšia šípka ponúka aj export do formátov PDF, CSV a PNG (obrázok sekvencie).
γ (gamma) je diskontný faktor – vyššia hodnota preferuje dlhšie cesty. R(g) je odmena za dosiahnutie cieľa, R(o) odmena za návštevu ostatných stavov. ε (epsilon) je prah konvergencie – menšia hodnota znamená presnejšie výpočty, ale viac iterácií.
Áno, po vygenerovaní matice podobností môžete prepnúť medzi tabuľkovým zobrazením (matica) a grafovým zobrazením (sieť) pomocou tlačidiel '🔢 Matica podobností' a '🕸️ Graf podobností'. V grafe môžete kliknutím na uzol zobraziť jeho najsilnejšie spojenia.
Potrebujete ďalšiu pomoc? Kontaktujte nás na xdrengubiak@stuba.sk
Táto webová aplikácia je poskytovaná ako služba bez akýchkoľvek záruk. Používateľ súhlasí s tým, že používa aplikáciu na vlastné riziko.
Aplikácia nezhromažďuje ani neukladá žiadne osobné údaje používateľov. Všetky analýzy prebiehajú lokálne v prehliadači.
Vytvárané sekvencie vzorov sú iba návrhmi a odporúčaniami. Autor ani FIIT STU nepreberajú zodpovednosť za dôsledky ich implementácie.
Všetky práva k aplikácii sú vyhradené. Obsah môže byť používaný len pre osobné a nekomerčné účely.
Platné od 1. januára 2026
Stop slová sú bežné slová, ktoré sa ignorujú pri analýze. Pridávajte ich ako jednotlivé slová (bez medzier).
Enterom potvrdíš, slovo musí byť bez medzier a dlhé aspoň 2 znaky.
Používame anonymné štatistiky na zlepšenie aplikácie. Žiadne osobné údaje nezbierame.