Ciao!

    Ho trascorso l’ultimo anno e mezzo a formare una serie di LLM (modelli linguistici? Modelli ai?). Ho pensato che la gamma di modelli linguistici moderni in svedese fosse troppo scarsa (all’inizio c’era solo una variante più grande basata su gpt2) e ho deciso di provarlo io stesso. L’obiettivo era innanzitutto quello di migliorare la lingua, ma anche di introdurre una conoscenza più incentrata sulla Svezia. Il risultato è stato "fattorino".

    https://preview.redd.it/ft9lzfkuaxde1.png?width=400&format=png&auto=webp&s=f22834190824dc46bf79359b51951bddbd12e184

    Il metodo che utilizzo è quello "finetuna" modelli esistenti con i propri set di dati, e ce ne sono stati alcuni nella gamma di dimensioni inferiori (parametri 7b-12b).

    Finora non ne ho mai parlato r/Sveziaquindi ho pensato che fosse giunto il momento. Se qualcuno vuole provarli localmente (richiede un po’ di know-how tecnico e una scheda grafica relativamente moderna), eccoli qui: https://huggingface.co/neph1

    C’è anche una versione molto lenta dell’ultima versione con cui puoi chattare online, qui: https://huggingface.co/spaces/neph1/bellman . Ma richiede anche l’impostazione di alcuni valori. Mi metto al lavoro per creare un’app più snella.

    Prendeteli per quello che sono, frutto di una felice ossessione dilettante. I fatti a volte sono sbagliati, ma cosa puoi aspettarti da un poeta?

    Bellman säger: "Hej, vad jag kan hjälpa dig med?"
    byu/neph1010 insweden



    di neph1010

    Share.
    Leave A Reply