motore di ricerca semantico interno

Tutti i metodi di promozione dei siti web portano gli utenti sul sito: da quando l'utente 'atterra' sul sito è importante che possa in poco tempo trovare ciò che cerca.

Il motore di ricerca interno è l'elemento più importante per svolgere questo compito; nonostante siano possibili molti metodi per guidare l'utente verso l'eventuale contenuto che gli è utile (menu, breadcrumb, livelli..) la ricerca interna assolve ad un ruolo fondamentale cercando di collegare l'intenzione di ricerca dell'utente con i prodotti/servizi.

Non a caso la più grande azienda informatica al mondo ha preso le mosse da un motore di ricerca; cercare di collegare l'intenzione di ricerca dell'utente con la pagina-target a lui espressamente dedicata è uno dei compiti più complicati perchè implica un passaggio di conoscenze dall'utente al sistema mediato dal linguaggio scritto.


conoscenza della domanda -> espressione con parola -> | query string |-> interrogazione della conoscenza -> pagina candidata alla risposta


La complessità per l'utente è passare da un concetto ad una parola; dal lato del sito, invece, è il procedimento contrario: passare dalla parola digitata al concetto espresso, per verificare se esista una pagina contenente quel concetto.


Per facilitare la prima fase si possono mettere in atto accorgimenti che aiutino l'utente a digitare la parola:
  • con l'autocomplete, cercando di completare la parte di testo mentre l'utente lo sta digitando; ci si può aiutare in diversi modi:
    • con un lemmario, che riporta tutti i termini della lingua in uso
    • con un elenco di keyword che corrispondono agli argomenti trattati dal sito; in questo caso la parte complessa è il reperimento di un numero sufficiente di keyword che siano rappresentative dei contenuti
  • con i suggerimenti, cercando di suggerire  termini diversi da quello che si digita, anche in questo caso mentre l'utente sta digitando. C'è una certa complessità nel farlo: prima si deve completare ciò che l'utente sta digitando, quindi si devono suggerire termini semanticamente correlati, cioè con significato simile. Per poter trovare questa correlazione è necessario avere a disposizione una tabella che per ogni termine riporti quali altri termini gli sono vicini, attraverso ad una matrice di correlazione. La costruzione di questa matrice è uno degli obbiettivi dell'analisi dei testi attraverso l'intelligenza artificiale.
 A questo punto l'utente è stato aiutato nel formulare la domanda, sia dal punto di vista ortografico (lemmario) che da quello semantico (keyword); tocca a questo punto alla conoscenza lato server interpretare la parola, o le parole, espresse dall'utente per rispondere con un contenuto, cioè con una pagina del sito, che contenga la risposta all'interrogazione dell'utente. Possono essere messi in atto più metodi:
  1. Per sottostringa. E' il metodo più utilizzato; si interroga un database cercando pagine che nel titolo, nel testo o in altre parti (es.: testo alternativo dell'immagine, nomi di file) contengano esattamente la sottostringa digitata.
  2. Per correlazione semantica a livello di keyword; attraverso la matrice di correlazione tra keyword prima vista, si eseguono due operazioni:
    1. si cerca l'elenco delle keyword più vicine a quella digitata, ordinandole per distanza semantica crescente
    2. si cerca la pagina che contenga le keyword così individuate, possibilmente con la stessa distribuzione di valore semantico delle keyword nella pagina. Ovviamente per poter mettere in atto questa fase si deve avere a disposizione una mappatura completa dei contenuti sulle keyword, analisi lessicale di una certa complessità.
  3. Per correlazione semantica a livello di contenuto. Se il punto precedente risponde con un buon livello di confidenza statistica con una pagina, si possono cercare altre pagine semanticamente vicine; A questo livello è necessaria una matrice della correlazione semantica dei contenuti, normalmente ottenuta attraverso analisi di deep learning con word embeddings.

Abbinando le due fasi si ottiene un motore di ricerca semantico che cerca di 'capire' l'intento dell'utente per rispondere nel modo migliore possibile; ovviamente questo tipo di interrogazione porterà molto più velocemente l'utente verso il risultato cercato, aiutando il sito a raggiungere il suo scopo, sia esso di vendita o di promozione e ricerca di contenuti.

L'integrazione attraverso un sistema di marketing per la promozione di alcuni prodotti rispetto altri può integrare il sistema per favorire le vendite o la promozione di alcuni contenuti rispetto altri.

 
Come si realizza un motore di ricerca semantico?

Dogma Dynamics si occupa proprio di questo, a due livelli:

  1. progettando e realizzando il motore semantico ad hoc per l'architettutra del sito di destinazione
  2. fornendo API che attraverso l'integrazione di un semplice script consentono ai siti di trasformare il proprio motore di ricerca in un motore di ricerca semantico.