Progetto R - Introduzione
Immagini
R-project è un'applicazione software autonoma e un ambiente di programmazione che supporta il linguaggio statistico R. R è un linguaggio di programmazione di uso generale e un ambiente software gratuito con licenza BSD per lo sviluppo di applicazioni e calcoli statistici in Visual Basic. È ampiamente utilizzato dai data miner e dai ricercatori statistici per sviluppare applicazioni statistiche e di analisi dinamica dei dati. I pacchetti statistici utilizzati da R aiutano ad analizzare grandi insiemi di dati con l'aiuto di diversi metodi statistici e di calcolo.
R è un'applicazione software gratuita e quindi può essere scaricata da Internet per scaricare i componenti necessari ed eseguire il software di calcolo statistico. I principali vantaggi del software R-project rispetto ad altri pacchetti gratuiti di calcolo statistico sono: può essere eseguito su tutti i principali sistemi operativi, dispone di un ampio database che copre quasi tutte le aree del calcolo statistico, è multipiattaforma con una serie di opzioni di implementazione disponibili, può gestire l'analisi dei dati in tempo reale e può persino implementare il tempo negli algoritmi statistici. Un altro vantaggio del progetto R rispetto ad altri pacchetti software gratuiti simili è la sua velocità, con le prestazioni più elevate tra tutti i pacchetti di calcolo statistico. È un software open source e quindi può essere utilizzato facilmente da persone di diversa estrazione senza alcuna esperienza precedente di programmazione. È scritto in un linguaggio di alto livello (R) che lo rende facile da manipolare ed estendere.
Il pacchetto R può essere utilizzato per analizzare, manipolare e prevedere i mercati finanziari. Per analizzare e visualizzare gli insiemi di dati è necessario avere alcune conoscenze di statistica come la probabilità, la funzione intervallo, il tasso di crescita degli anelli degli alberi, il valore medio, la deviazione degli insiemi di dati, la stima della massima verosimiglianza, il valore t, il valore chi-quadro, l'indipendenza e i test di significatività. È inoltre necessario avere una certa conoscenza dell'algebra lineare e buone capacità matematiche. L'approccio migliore all'inferenza statistica è quello di utilizzare i pacchetti R lattice e lasso. I pacchetti Lasso e lattice forniscono un potente metodo di regressione logistica, alberi decisionali e reti neurali per dati ad alta dimensionalità.