R + POSTGRESQL
- Santiago Díaz
- 23 de fev. de 2018
- 2 min de leitura
Atualizado: 8 de jun. de 2019
Neste tutorial aprenderemos como usar os pacotes RPostgreSQL e DBI do programa computacional R project. O R é um software livre para computação estatística e gráfica, que conta com uma ampla variedade de pacotes desenvolvidos nas diversas áreas do conhecimento.
Nas ciências da terra usualmente são coletadas diversas informações as quais devem ser armazenadas e relacionadas num banco de dados. O banco de dados é uma coleção organizada de dados, que permite de maneira eficiente uma busca rápida da informação, bem como a sua recuperação. Além disso, define-se como o banco de dados relacional a conformação do banco por: esquemas (schemas), tabelas, entre outros elementos.
No tutorial será utilizado o conjunto de dados meuse do pacote sp.
POSTGRESQL
O primeiro passo será criar um banco de dados no programa usando o programa pgAdmin 4.



Uma vez o Server foi criado, uma base de dados o e Schema devem ser gerados com nomes de preferência. Em este exemplo, o nome da base de dados será meuse, e o nome do schema será teste.


RPostgreSQL
A seguir será realizada a conexão entre o banco de dados no PostgreSQL, dado que a base de dados meuse foi criada no programa pgAdmin 4. A ligação ou conexão entre estes dois programas é feita através do pacote RPostgreSQL dentro do programa computacional estatístico R.

Em uma base de dados podem existir vários schemas. Por padrão public pertence a qualquer banco de dados dentro do elemento schemas. Através do programa R qualquer tabela dentro de um schema pode ser acessada usando o comando: nome do esquema mais o nome da tabela separada por um ponto. A seguir se ilustra, por meio de comandos, a existência de uma tabela em um schema.

Uma vez comprovada à existência da tabela, geramos a tabela usando o conjunto de dados meuse.


O comando dbListTables permite visualizar a lista de tabelas do banco de dados, o qual foi acessado. Por outro lado, o usuário geralmente está interessado em trabalhar com variáveis especificas dentro de qualquer tabela. Isto, pode ser realizado para nosso exemplo para a variável continua elev como segue:

dbSendQuery contém várias funcionalidades. Entre essas funcionalidades permite filtrar o conjunto de dados dentro da tabela a partir de uma dada condição. Este filtro é de grande importância, por exemplo, quando desejamos filtrar o a tabela meuse a partir da variável solo quando está toma o valor de 1.


A seguir se ilustra outro tipo de filtragem aplicado a nossa tabela. Neste casso o filtro é para três diferentes variáveis de interesse (x, y e copper) dentro da tabela usando como condição o tipo de ocupação do solo.


Comments