Metadata-Version: 2.1
Name: basedosdados
Version: 1.0.2
Summary: Organizar e facilitar o acesso a dados brasileiros através de tabelas públicas no BigQuery.
Home-page: https://github.com/base-dos-dados/bases
License: MIT
Author: Joao Carabetta
Author-email: joao.carabetta@gmail.com
Requires-Python: >=3.6,<4.0
Classifier: License :: OSI Approved :: MIT License
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Programming Language :: Python :: 3.8
Classifier: Topic :: Software Development :: Build Tools
Classifier: Topic :: Software Development :: Libraries :: Python Modules
Requires-Dist: Jinja2 (==2.11.2)
Requires-Dist: click (==7.1.2)
Requires-Dist: google-cloud-bigquery (==1.28.0)
Requires-Dist: google-cloud-storage (==1.31.2)
Requires-Dist: pandas-gbq (==0.13.2)
Requires-Dist: pyaml (==20.4.0)
Requires-Dist: tomlkit (==0.7.0)
Project-URL: Repository, https://github.com/base-dos-dados/bases
Description-Content-Type: text/markdown

<p align="center">
  <a href="https://basedosdados.github.io/mais/">
    <img src="https://github.com/basedosdados/mais/raw/master/docs/images/bdmais_logo.png" width="320" alt="Base dos Dados Mais">
  </a>
</p>

<p align="center">
  <strong>
    Mecanismo de busca e repositório de bases de dados
  </strong>
</p>

O intuito do projeto é organizar e facilitar o acesso a dados brasileiros através de tabelas públicas no BigQuery.
Qualquer pessoa poderá fazer queries em bases tratadas e documentadas que estarão disponíveis e estáveis.

Uma simples consulta de SQL será o suficiente para cruzamento de bases que você desejar. Sem precisar procurar, baixar, tratar, comprar um servidor e subir clusters.

Veja nossa documentação [**aqui**](https://basedosdados.github.io/mais/).

## Instale nosso CLI

`pip install basedosdados`

**Incentivamos que outras instituições e pessoas contribuam**. Só é requerido que o processo de captura e tratamento sejam públicos e documentados, e a inserção dos dados no BigQuery siga nossa metodologia descrita abaixo.

#### Porque o BigQuery?

Sabemos que estruturar os dados em uma plataforma privada não é o ideal para um projeto de dados abertos. Porém o BigQuery oferece uma infraestrutura com algumas vantagens:

- É possível deixar os dados públicos, i.e., qualquer pessoa com uma conta no Google Cloud pode fazer uma query na base, quando quiser
- O usuário (quem faz a query) paga por ela. Isso deixa os custos do projeto bem baixos
- O BigQuery escala magicamente para hexabytes se necessário
- O custo é praticamente zero para usuários. São cobrados somente 5 dólares por terabyte de dados que sua query percorrer, e os primeiros 5 terabytes são gratuitos.

### Desenvolvimento

#### CLI

Suba o CLI localmente

```sh
make create-env
. .bases/bin/activate
```

#### Versionamento

Publique nova versão

```sh
poetry version [patch|minor|major]
poetry publish --build
```

#### Docs
Atualize os docs adicionando ou editando `.md` em `docs/`.

Se for adicionar um arquivo novo, adicione ele em `mkdocs.yml` sob a chave `nav`.

Para testar a documentação, rode:

```sh
mkdocs serve 
```


