Esercizi - 3. L'interazione
Scegliete, tra quelli descritti nel Paragrafo 3.5, due stili d’interfaccia di cui avete esperienza. Usate il modello dell’interaction framework per analizzare l’interazione implicita nell’utilizzo di questi stili d’interfaccia per estrarre delle informazioni da un database. Quale delle distanze descritte dal modello è maggiore nei vari casi?
Risposta
Per questo esercizio non c’è un’unica risposta, quindi daremo un esempio di stile di risposta adatto e il livello di analisi appropriato.
Dovreste sapere che, sebbene venga usato il termine distanza, non è stata associata alcuna misura reale a nessuna delle traduzioni nell’interaction framework. Di conseguenza, questa analisi può essere solo informale e avere origine dall’intuizione e dall’esperienza di vari stili d’interfaccia. Come è stato detto nel Paragrafo 3.2.3, la valutazione di un’interazione con l’interaction framework può essere solo relativa a un compito. Per questo esempio sceglieremo un semplice compito di selezione di record da un database bibliografico in linea. I due stili d’interfaccia che analizzeremo sono un’interfaccia a linguaggio naturale e una a riga di comando.
Il compito è selezionare dal database bibliografico una serie di riferimenti che soddisfino alcuni criteri di ricerca.
Una volta che è stato formulato nel task language dell’utente (per esempio, l’utente vuole vedere tutti i libri scritti da Alan Dix dal 1990), il compito deve essere articolato nel linguaggio d’input. Lo stile d’interfaccia a linguaggio naturale consentirebbe di immettere l’interrogazione di selezione esattamente come la si pensa. La distanza di articolazione è breve sia perché l’interrogazione è facile da articolare (e ancor di più se viene fornita un’interfaccia parlata invece della digitazione) sia perché la copertura è totale (si può articolare qualunque cosa come interrogazione). D’altra parte, per l’interfaccia a riga di comando, il vocabolario limitato del linguaggio d’input rende più difficile articolare un compito, anche se il linguaggio consente una copertura completa in termini di possibili interrogazioni. La vera difficoltà per l’interfaccia a linguaggio naturale è il modo in cui il sistema traduce l’espressione d’input nell’interrogazione che accede ai record della bibliografia. La traduzione della prestazione sarà molto più facile per l’interfaccia a riga di comando perché quest’ultima può anche non richiedere la traduzione dell’espressione d’input, essendo quel linguaggio già stato costruito con il motore di database in mente. Possiamo vedere, quindi, che per l’interfaccia a linguaggio naturale, la distanza più grande è quella in termini di prestazione, mentre per l’interfaccia a riga di comando è quella di articolazione. L’analisi precedente, però, tratta le sole traduzioni esecutive. Dal punto di vista della valutazione, l’interfaccia a linguaggio naturale deve cercare di presentare i risultati dell’interrogazione al database nella stessa forma in cui l’utente ha espresso l’interrogazione. In genere, questa può essere una traduzione difficile per il sistema, che deve rispondere alle domande nello stile arbitrario in cui sono state poste dall’utente. Se però ci si riesce, l’osservazione da parte dell’utente dovrebbe essere facile.
Per l’interfaccia a riga di comando, non ci sono garanzie che il risultato dell’interrogazione venga visualizzato automaticamente e può darsi che l’utente debba richiederlo esplicitamente (e specificare anche il tipo di formattazione). Trascurando questo aspetto, la presentazione è più facile, perché il linguaggio di output può essere molto vincolato. L’osservazione è resa più difficile, perché l’utente deve tradurre l’output in termini della formulazione originale del compito. Per esempio, avendo chiesto i libri di Alan Dix pubblicati dopo il 1990, può essere difficile trovare il nome dell’autore e l’anno di pubblicazione di un testo per determinare se i record risultanti soddisfano le aspettative.
Per quanto riguarda la valutazione, l’interfaccia a linguaggio naturale ha una maggior distanza di presentazione e l’interfaccia a riga di comando una maggior distanza di osservazione. In generale, perciò, ci si aspetterebbe che l’interfaccia a riga naturale sia più facile da usare dal punto di vista dell’utente, ma più difficile dal punto di vista di chi ha creato il sistema; l’opposto dovrebbe valere per un’interfaccia a linguaggio di comando. Ci sono alcuni problemi che in questo caso non sono stati affrontati, per esempio la visualizzazione di molti record che soddisfano l’interrogazione e la possibilità di riusare l’output di un’interrogazione come input della successiva al fine di eseguire le ricerche complesse con facilità. Poiché la traduzione in termini di prestazioni è più complessa per lo stile d’interfaccia a linguaggio naturale, è importante che l’interfaccia a linguaggio naturale presenti i risultati dell’interrogazione in modo che l’utente possa determinare se il sistema ha inteso l’interrogazione originale nel modo che lui aveva previsto. Questo implica la traduzione della presentazione reiterando simultaneamente sia l’interrogazione sia i record selezionati. Nel nostro esempio, poiché l’utente era interessato all’autore e alla data di pubblicazione, sarebbe opportuno che quelle informazioni venissero messe in evidenza all’interno dei risultati. Non è stato considerato, nemmeno, quale effetto ha l’esperienza d’uso del sistema. Man mano che gli utenti si abitueranno alla sintassi e alla semantica di un linguaggio di comando, si presuppone che le difficoltà diminuiranno. Un altro problema è che un output in linguaggio naturale prolisso può limitare il numero di record che si possono visualizzare simultaneamente.
La conclusione, quindi, è che nonostante le analisi informali suggerite dall’esercizio siano molto affascinanti, non possono rappresentare l’ultima parola sull’analisi di un sistema interattivo; invece, i nostri giudizi devono essere diventare più precisi e concreti.
Cercate quanto più materiale potete sulle interfacce a linguaggio naturale. Vi sono sistemi di successo? Per quali applicazioni sono più appropriati?
Risposta
Questo esercizio è progettato per incoraggiare la ricerca personale sotto forma di un breve esame della letteratura tecnica. L’ideale è iniziare questa ricerca partendo da libri di testo generali sull’intelligenza artificiale (per esempio, An Introduction to Artificial Intelligence di Janet e Alan) che forniranno le informazione di base sull’elaborazione del linguaggio naturale e su sistemi famosi come SHRDLU; da atti di conferenze come AAAI e riviste scientifiche specialistiche che conterranno vari articoli aggiornati di ricerca in questo campo; da atti di conferenze HCI come CHI, Interact e HCI che tratteranno di sistemi di elaborazione del linguaggio naturale particolarmente adatti all’interfaccia.
Altre fonti simili sono riviste famose come quelle relative ai personal computer e BYTE, che contengono recensioni di sistemi commerciali. La risposta dello studente alla seconda parte della domanda dipenderà da cosa scoprirà, ma è probabile che i sistemi che troverà operino in domini molto ristretti e che il linguaggio naturale usato sia limitato. Finora non ci sono interfacce a linguaggio naturale general purpose.
Quale influenza ha l’ambiente sociale in cui lavorate sull’interazione uomo-macchina? Quale effetto ha l’organizzazione (commerciale o universitaria) cui appartenete sull’interazione?
Risposta
Lo scopo di questo esercizio è esplorare le influenze sociali e ambientali che agiscono sull’interazione, spesso senza che l’utente ne sia consapevole. Cambiano da ambiente ad ambiente, ma è consigliabile considerare alcuni o tutti i seguenti elementi.
In
ogni caso considerate quali influenze possono esserci sull’interazione. Può
essere utile considerare altri possibili ambienti per identificare come l’interazione
differirebbe in circostanze diverse. Per esempio, se attualmente condividete
un computer con i colleghi, le vostre regole d’interazione cambierebbero se
vi venisse dato un computer personale?
Nei
Capitoli 14 e 15 viene esaminata anche l’influenza di gruppi di lavoratori
all’interno di un’organizzazione sull’interazione
e vengono suggerite ulteriori letture su questo argomento.
a) Raggruppate le funzioni seguenti sotto intestazioni appropriate, supponendo che debbano costituire la base per un sistema di word-processing guidato dai menu; le intestazioni che scegliete diventeranno i titoli dei menu e le funzioni appariranno sotto il menu appropriato. Potete optare per molti o pochi titoli di menu e, se preferite, potete anche modificare leggermente i nomi delle opzioni:
salva, salva con nome, nuovo, cancella, apri posta, invia posta, esci, annulla, tabella, glossario, preferenze, stile carattere, formato paragrafo, lay-out documento, posiziona sulla pagina, testo normale, grassetto, corsivo, sottolineato, apri file, chiudi file, apri copia del file, aumenta dimensione in punti, riduci dimensioni in punti, cambia font, aggiungi note a piè di pagina, taglia, copia, incolla, cancella, impagina, aggiungi interruzione di pagina, inserisci grafico, inserisci voce d’indice, stampa, anteprima di stampa, impostazione pagina, visualizza pagina, trova parola, cambia parola, vai a, torna indietro, controllo ortografia, visualizza indice, vedi sommario, conteggio parole, numera pagine, ripeti modifica, mostra documento alternativo, guida
b) Se possibile, mostrate ad altri le intestazioni che avete ideato e chiedete loro di raggruppare le funzioni sotto le intestazioni. Confrontate i loro raggruppamenti con i vostri. Dovreste identificare le aree simili e quelle differenti; spiegate similitudini e discordanze.
Risposta
Analisi a risposta aperta
Usando i raggruppamenti delle funzioni dell’Esercizio 3.4, calcolate il numero di elementi nei menu.
a) Qual è la media?
b) Esperimento facoltativo
Risposta:
a) La risposta dipende da quella data all’Esercizio 3.4. Mettendo contemporaneamente tutte le funzioni sullo schermo il problema è che occupano troppo spazio e ne lasciano troppo poco per qualsiasi altra cosa. Troppe intestazioni di menu rendono difficile per l’utente stabilire sotto quale di esse si trova uno specifico comando e troppo poche comportano il fatto che ogni menu sia costituito da molti elementi, il che complica il compito di ricerca visuale necessario per individuare la voce di menu e aumenta il tempo medio necessario per trascinare il mouse e scegliere un’opzione. La legge di Fitts consente di capire l’impatto della lunghezza dei menu e dei tempi di selezione.
Tenderemmo a optare per un numero maggiore di menu più piccoli, con il presupposto che sia possibile porre dei chiari confini concettuali tra le categorie di menu. Se otto categorie portano a una scomposizione dei comandi facile da capire, sarà più semplice decidere quale menu selezionare e poi sarà veloce scegliere un elemento di menu tra poche opzioni. Un numero ridotto di menu potrebbe creare indecisione sulla posizione degli elementi.
Descrivete (anche graficamente) il modello dell’interaction framework. Mostrate come può essere usato per spiegare i problemi nel dialogo tra utente e computer.
Descrivete brevemente i quattro stili d’interazione che possono essere usati per gestire il dialogo tra utente e computer.
Lo schermo tipico dei computer ha un’impostazione WIMP; che cosa significa WIMP? La maggior parte delle interfacce WIMP più diffuse funziona sulla base di una metafora della scrivania, in cui le azioni abituali sono assimilate ad analoghe azioni compiute nel mondo reale. Per esempio, lo spostamento di un file avviene selezionandolo e trascinandolo in una cartella o in un archivio. Il vantaggio di usare una metafora è che l’utente può identificarsi con l’ambiente presentato sullo schermo, inoltre può prevedere più facilmente il risultato delle sue azioni. Notate che la metafora può non essere sempre valida. Cos’è l’equivalente della formattazione di un disco nel mondo reale? C’è un’analogia diretta per il concetto di "annullare" un’azione? Pensate ad altri esempi.
Risposta
Aperta