EasyVR ultimo aggiornamento 18 luglio 2016 |
|
Il modulo
EasyVR permette
di dotare le vostre applicazioni della capacità di riconoscimento vocale, oltre a
questo è presente una funzione di riproduzione del suono (un massimo di 9 minuti di audio registrato
o discorso).
Commercializzato dalla VeeaR
che è un marchio di prodotti di alta qualità a bassi costi per l'aggiunta di
funzionalità integrate di riconoscimento vocale per qualsiasi applicazione.
La linea di prodotti VeeaR offrono una serie di prodotti progettati per aiutarvi
a sviluppare e attuare le capacità di riconoscimento vocale per applicazioni in
cui è richiesto il comando vocale.
La scheda è stata messa a
punto con la collaborazione della RoboTech srl, che
tra l'altro ha
progettato e sviluppato le funzionalità, l'elettronica ed il software
del
robot
I-Droid 01.
Il modulo può utilizzare sia i wordset "Speaker
Independent"
(SI) già inseriti nel modulo oppure fino a 32 comandi "Speaker
Dependent"
(SD) addestrabili dall'utente
Il modulo permette di interagire
vocalmente con il robot, il riconoscimento di tali comandi, avviene
attraverso l'identificazione di parole predefinite, inserite nella
memoria della scheda elettronica del modulo.
Per rendere comprensibili al robot le parole
pronunciate, è indispensabile parlare in modo naturale, non
eccessivamente veloce e senza enfatizzare il tono, ad una distanza,
ideale, di circa 60 cm dal microfono.
Naturalmente, la percezione/comprensione delle
parole da parte del processore, è influenzata dall'ambiente circostante:
ambienti in cui ci sono disturbi, eco o riverbero, influenzano
negativamente, il riconoscimento dei comandi vocali.
Per la programmazione della scheda viene utilizzata la scheda Arduino su viene caricato
un'apposito programma "bridge".
Caratteristiche del modulo EasyVR
Supporto di 28 comandi già
registrati di tipo Speker Indipendent (SI) comandi pronti per eseguire i
controlli di base. Sono supportate le seguenti lingue:
-
Inglese (Stati Uniti)
-
Inglese (Inghilterra)
- Italiano
-
Tedesco
-
Francese
-
Spagnolo
- Coreano
-
Giapponese
Supporto sino a 32 comandi vocali definiti dall'utente del tipo Speaker Dependent (SD) trigger o password.
Facile da usare, semplice interfaccia grafica per la programmazione dei comandi vocali e audio
Semplice e robusto protocollo seriale documentato per la programmazione.
3 x linee GPIO (IO1, IO2, IO3) che possono essere controllati da nuovi comandi del protocollo
PWM uscita audio che supporta altoparlanti da 8 ohm.
Funziona con qualsiasi host con una interfaccia UART alimentato a 3.3V-5.0V.
Funzione di riproduzione del suono di un massimo di 9 minuti di audio registrato o discorso
Funziona anche con ROBONOVA e Robozak MR-C3024 schede di controllo, nonché Basic Stamp Parallax.
l modulo EasyVR si presenta come una piccola scheda dalle dimensioni di 45x24mm
Foto della scheda EasyVR
|
General Purpose I / O
Dal momento che l'interfaccia di
comunicazione EasyVR utilizza due pin del controller host, alcuni pin I/O sono disponibili,
e possono essere controllati con il protocollo di
comunicazione, per essere utilizzati per attività di base, come ad
esempio attivazione di un LED luminoso.
I tre pin di I/O IO1-IO3 sono collegati direttamente al microcontrollore
integrato sul modulo EasyVR, essi hanno funzionano con una tensione di 3.0V regolata internamente. Se
si ha bisogno di interfacciarsi ai circuiti che utilizzano una tensione diversa, ci sono una serie di soluzioni che si possono adottare.
Alcuni di questi sono riportate qui di seguito.
Utilizzare un pin come uscita
Tutti i pin di I/O sono ingressi con debole pull-up interno dopo l'accensione. È necessario configurare esplicitamente un pin prima di poterlo utilizzare come uscita
Pin di I/O che pilota direttamente un led a bassa corrente
Pin I/O connesso ad un circuito funzionante a 5V ad alta impedenza, come un input di un processore
Pin I/O che aziona un carico su una linea ad alto voltaggio utilizzando un relè a 12V.
I valori dei componenti esatti in questi circuiti possono variare. È necessario calcolare i valori necessari per l'applicazione e la scelta dei componenti. Per esempio, valore di resistenza per il circuito LED può essere calcolato come:
Dove VLED è il LED di tensione diretta, come riportato nella scheda tecnica a
LED, al corrente di pilotaggio IOH (vedere la sezione Caratteristiche
elettriche).
Supponiamo che una tipica LED a bassa corrente ha un VF = 1,8 V a 5 mA, il valore della resistenza è:
Ora per stare sul sicuro è meglio scegliere una resistenza leggermente più grande, come ad
esempio 150Ω.
Se si vuole pilotare LED di corrente più elevate, è necessario un circuito come
la seconda, dove si mette il LED tra la resistenza di uscita e il collettore del
transistor NPN.
Utilizzare un pin come input
Tutti i pin di I/O sono ingressi con debole pull-up interno dopo l'accensione o reset. È anche possibile configurare il pin di avere un forte pull-up o nessuna pull-up per tutti.
Tutti questi circuiti assumono
che il pin EasyVR è stato configurato con un
pull-up interno (passivo valore di componenti può essere regolato per tenere
conto di debole o forte pull-up).
Disabilitare il pull-up interno potrebbe essere utilizzato per mettere il pin
in stato di alta impedenza, per esempio, di simulare una porta di uscita a tre
stati o open-drain.
Anche in questo caso, si dovrebbe vedere la scheda tecnica del produttore quando
si interfaccia tutti i componenti esterni e di calcolare i valori richiesti
resistenze o altri componenti passivi.
U1: il processore principale prodotto
dalla Sensory,
è il modello RSC-4128 nella versione DIE in cui
l'involucro protettivo è rappresentato da una goccia di resina.
U2: è una memoria SST 39VF040 del
tipo Flash con una tensione di alimentazione 2.7-3.6V, la sua capacità è
di 4 Mbit ed è garantita per 10.000 cicli di registrazione.
U3: è uno speciale integrato GTL2002
prodotto dalla che permette di traslare i livelli di tensione di 5V dal
lato TTL del robot a quelli 3.0V della scheda VRbot.
U4: è un regolatore di tensione positiva tipo
S1131 prodotto dalla Seiko Instruments Inc con un basso low dropout,
alta precisione della tensione di uscita e un basso consumo realizzato
con tecnologia CMOS.
U5: è una memoria EEprom tipo 24LC64
prodotta dalla Microchip, ha una capacità 64k del tipo 2-wire serial
interface.
X1: è un risuonatore ceramico che fornisce il clock al processore
ed ha un valore di 3.58MHz.
Sullo shield sono inoltre presenti due integrati U1 e U2 tipo 74HC125 Quad buffer/line driver; 3-state, più diversi transistor SMD per l'adattamento dei livelli.
Processore RSC-4128 | ||
|
|
|
Piedinatura | Datasheet | Foto dell'integrato |
The RSC-4128 represents Sensory’s next generation mixed signal processor for speech and analog I/O. The RSC-4128 is designed to bring advanced speech I/O features to cost sensitive embedded and consumer products. Based on an 8-bit microcontroller, the RSC-4128 integrates speech-optimized digital and analog processing blocks into a single chip solution capable of accurate speech recognition; high quality, low data-rate compressed speech; and advanced music.
Products can use one or all features in a single application.
The RSC-4128 operates in tandem with Sensory Speech™ 7 firmware,
an ultra compact suite of recognition and synthesis technologies. This reduced software footprint enables, for example, products with over 150 seconds of compressed speech, multiple speaker dependent and independent vocabularies, speaker verification, and all application code built into the RSC-4128 as a single chip solution.
Revolutionary Text-to-Speaker-Independent (T2SITM) technology allows the creation of SI recognition sets by simply entering text.
In addition to improved recognition performance, the RSC-4128 provides further on-chip integration of features.
FEATURES
FULL RANGE OF SENSORY SPEECH™ 7 CAPABILITIES
Enhanced Word Spotting capability (10 SI or 4 SD words) in parallel
Noise robust Speaker Independent, Dependent & Continuous Listening recognition
High quality, 3.7-7.8 kbps speech synthesis & sound effects with Sensory “SX” synthesis technology
Speaker Verification (SVWS) – Noise robust voice biometric security
8 voice MIDI-compatible music synthesis coincident with speech; drum track feature enables additional voices
Voice record & playback
Audio wake up from sleep
INTEGRATED SINGLE-CHIP SOLUTION
8-bit microcontroller
On-chip 16 bit ADC, 10 bit DAC and microphone pre-amp
Independent, programmable Digital Filter engine
Uses low cost 3.58MHz crystal (internal PLL)
4.8 KB total RAM (256Bytes user-RAM)
Five timers (3 GP, 1 Watchdog, 1 Multi Tasking)
Twin-DMA, Vector math accelerator, and multiplier
External memory bus: 20-bit Address(1Mbyte), 8-bit Data
On chip storage for SD, SV, templates (10 templates)
Code security through no ROM dump capability
Built-in Analog Comparator Unit (4 inputs)
Low EMI design for FCC and CE requirements
24 configurable I/O lines with 10 mA (typical) outputs
Fully nested interrupt structure with up to 8 sources
LONG BATTERY LIFE
2.4 – 3.6V operation
12mA (typical) operating current at 3V
2 low power modes; 1 µA typical sleep current
Memoria Flash - SST 39VF040 4 Mbit | ||
Piedinatura | Datasheet | Foto dell'integrato |
GTL2002 - 2-bit bidirectional low voltage translator | ||
Piedinatura | Datasheet | Foto dell'integrato |
S1131-E - high ripple-rejection low dropout middle output current cmos voltage regulator | ||
1-Vout 2-GND 3-Vin |
||
Piedinatura | Datasheet | Foto dell'integrato |
Memoria 24LC64 - 64K I2C™ Serial EEPROM | ||
Piedinatura | Datasheet | Foto dell'integrato |
74HC125 Quad buffer/line driver; 3-state | ||
Piedinatura | Datasheet | Foto dell'integrato |
Link al sito dell'azienda Robotech che
ha creato I-Droid 01 e il modulo EasyVR Shield
Elenco revisioni | |
18/07/2014 | Aggiornato pagina |
16/01/2014 | Aggiornato pagina |
07/10/2011 | Emissione preliminare |