Introdução às Bases de Dados O Que é uma Base de Dados? Poderá definir uma base de dados com uma colecção de dados sobre um tópico. Está organizada de forma a permitir escolher facilmente a informação, fazer alterações ou adicionar itens novos. Veja este diagrama para um dos exemplos acima: uma agenda simples. Um diagrama de uma base de dados de uma agenda Um diagrama de uma base de dados de uma agenda A imagem acima mostra um conjunto de dois contactos, sendo cada um deles apresentado num cartão em separado. Parece que cada um dos cartões poderá constituir uma linha única numa tabela: Tabela de Contactos Nome Núm. Tel. 699 23 43 12 Pedro 711 19 77 21 Termos e definições: Um dado simples que constitui uma parte de uma colecção maior poderá ser chamado de linha ou, de forma mais profissional, um registo. A colecção chama-se normalmente tabela. Para além disso, o nome mais natural para a tabela é um que descreve os dados que oferece/guarda, que é o Contactos. Depois disso, cada linha da tabela consiste em colunas, também chamadas de campos. Na tabela Contactos, existem duas colunas (campos): o Nome e o Num. Tel.. Para utilizações simples, uma única tabela poderá constituir uma base de dados. Muitas pessoas consideram estas duas equivalentes. Como poderá ver, para as base de dados reais, é necessário normalmente mais que uma tabela. Para resumir, já tem uma base de dados simples com uma tabela Contactos. Base de Dados e Folha de Cálculo É bastante provável que já tenha usado folhas de cálculo, como o KSpread, o OpenOffice.org Calc ou o Microsoft Excel. Se for o caso, irá pensar provavelmente: dado que tanto as folhas de cálculo como as bases de dados têm tabelas, porque é que deverei usar a última? Enquanto estiver a comparar as folhas de cálculo e as bases de dados, poderá encontrar as seguintes questões que irá ver mais tarde em maior detalhe: Integridade de referência dos dados Redundância dos dados Integridade e validade dos dados Limitar a visualização dos dados Performance e capacidade Introdução de dados convenientes Relatórios Programação Multi-usos Segurança No que Difere uma Base de Dados de uma Folha de Cálculo? Excedendo gradualmente a capacidade de um telemóvel, expanda a sua tabela Contactos ao adicionar uma coluna (campo) Endereço. Adicione mais números de telefone (escritório, casa) para cada pessoa e adicione apelidos aos nomes. Para simplificar, assumir-se-á o seguinte: a tabela está limitada a duas pessoas (obviamente, poderão existir centenas e milhares delas numa base de dados real) não existem duas pessoas com o mesmo nome e apelido Tabela de contactos Nome e apelido Tel Endereço José Pires 699 23 43 12 Rua do Zé 1, Lisboa Pedro Morais 711 19 77 21 Rua do Pedro 2, Porto José Pires 110 98 98 00 Rua do Zé 1 Pires José 312 43 42 22 Lisboa, Rua do Zé 1 PEDRO Morais 231 83 02 04 Rua do Pedro 2, Porto Uma tabela como esta tanto pode ser feita numa folha de cálculo como numa base de dados. Usar uma folha de cálculo é muito simples, claro. Quais são os problemas que encontra nesta altura? Integridade de referência de dados Suponha que está a usar uma folha de cálculo e necessita de alterar o endereço de, pelo menos, uma pessoa. Tem aí um pequeno problema: terá frequentemente de alterar o endereço em várias linhas. Por exemplo, o José ocupa três linhas. Um problema real levantar-se-á se se esquecer de alterar uma das linhas - o endereço atribuído a essa pessoa será ambíguo, logo os seus dados perdem integridade. Para além disso, não existe uma forma simples de remover uma pessoa escolhida da tabela, dado que terá de se lembrar de apagar todas as linhas relacionadas com ela. Redundância de dados Isto está ligado directamente ao problema anterior. Nos campos Nome e apelido e Endereço, são indicados os mesmos dados várias vezes. Isto é típico das folhas de cálculo, uma forma ineficiente de guardar dados, dado que a base de dados cresce desnecessariamente, consumindo mais recursos do computador (maior tamanho dos dados e um acesso mais lento). Como é que poderá resolver estes problemas com uma base de dados? Poderá dividir a informação em blocos mais pequenos se criar uma tabela adicional Pessoas com apenas duas colunas: Nome e apelido e Endereço: Tabela de Pessoas Nome e apelido Endereço José Pires Rua do Zé 1, Lisboa Pedro Morais Rua do Pedro 2, Porto Cada linha da tabela Pessoas corresponde a uma única pessoa. A tabela Contactos é, a partir de agora, uma relação com a tabela Pessoas. Integridade e validade dos dados Repare na forma como os dados são introduzidos nos campos Nome e apelido e Endereço. As pessoas que introduzem os dados poderão ser falíveis ou mesmo negligentes. Nos nossos dados de exemplo, existem sequências diferentes de introdução do mesmo nome e apelido (José Pires e Pires José; Pedro e PEDRO), entre outras formas de introdução do mesmo endereço. Obviamente, poderá pensar ainda mais outras formas. O problema acima mostra que, ⪚, ao procurar o número de telefone de uma pessoa que tenha o endereço "Rua do Zé 1, Lisboa", não irá obter um resultado completo. Irá obter uma linha apenas, em vez de três. Para além disso, não irá encontrar todos os números de telefone que procurem pelo valor "José Pires" no campo Nome e apelido, dado que o "Pires José" não é igual ao "José Pires". Como é que poderá resolver estes problemas com uma base de dados? Podê-lo-á fazer se alterar o desenho da tabela Pessoas da seguinte forma: Dividindo os dados no campo Nome e apelido em dois campos separados: Nome e Apelido. Dividindo os dados no campo Endereço em três campos separados Rua, Número de Porta e Localidade. Garanta a correcção dos dados: assegurando que os campos não estão vazios, ⪚, tem sempre de indicar o número da porta. Uma tabela modificada fica parecida com algo do género: Tabela de pessoas Nome Apelido Rua Número da porta Cidade Pires Rua do Zé 1 Lisboa Pedro Morais Rua do Pedro 5 Porto Condições campo obrigatório campo obrigatório campo obrigatório campo obrigatório campo obrigatório Graças à introdução das condições para campo obrigatório, poder-se-á garantir que os dados introduzidos estão completos. No caso das outras tabelas, poderá obviamente permitir a omissão de certos campos ao introduzir dados. Limitar a visualização dos dados Uma folha de cálculo mostra todas as linhas e colunas da tabela, o que poderá ser incómodo no caso de folhas de dados muito grandes. Poderá, obviamente, filtrar e ordenar as linhas nas folhas de cálculo, contudo deverá ter bastante cuidado ao fazê-lo. Os utilizadores da folha de cálculo estão em risco de se esquecer que os dados foram filtrados, o que poderá conduzir a erros. Por exemplo, ao calcular somas, poderá pensar que tem 100 linhas de dados visíveis, quando de facto estão mais 20 escondidas. Se quiser lidar com um pequeno sub-conjunto de dados, ⪚, para o enviar para outras pessoas editarem, poderá copiá-lo e colá-lo noutra folha de cálculo e, após a edição, colar os dados alterados de novo na folha de cálculo principal. Esta edição "manual" poderá provocar a perda de dados ou cálculos incorrectos. Para limitar a visualização dos dados, as aplicações de bases de dados oferecem pesquisas, formulários e relatórios. Uma forma muito prática de limitar a seguinte versão extendida da tabela Pessoas, descrita anteriormente: Tabela de pessoas Nome Apelido Rua Número da porta Cidade Vencimento Pires Rua do Zé 1 Lisboa 2300 Pedro Morais Rua do Pedro 5 Porto 1900 Vamos assumir que a coluna acabada de introduzir, Vencimento, contém dados confidenciais. Como é que poderá partilhar, ⪚, detalhes de contacto das pessoas com os seus colaboradores, mas sem revelar os seus vencimentos? É possível se partilhar apenas uma pesquisa e não a tabela inteira. A pesquisa poderia seleccionar todas as colunas, excepto a coluna Vencimento. No mundo das bases de dados, esse tipo de pesquisa é normalmente chamado de vista. Performance e capacidade O seu computador poderá ser muito rápido, contudo irá ver que não o ajudará com folhas de cálculo lentas e grandes. A sua eficiência baixa é, primeiro que tudo, devida à falta de índices que acelerem o processo de procura de dados (as bases de dados oferecem-nas). Para além disso, se usar coisas como a área de transferência do sistema, até a cópia de dados poderá ser problemática com o tempo. As folhas de cálculo que contenham grandes conjuntos de dados poderá levar uma eternidade a abrir. A folha de cálculo carrega um monte de dados para a memória do computador ao abrir. A maioria dos dados carregados será provavelmente inútil/desnecessária para si, de momento. As bases de dados, ao contrário das folhas de cálculo, carregam dados do disco do computador apenas se necessário. Na maioria dos casos, não terá de se preocupar como é que a base de dados guarda os seus dados. Isto significa que, ao contrário das folhas de cálculo, as bases de dados não se preocupam com: A sequência das linhas, dado que poderá ordená-las de acordo com as suas necessidades. Para além disso, poderá ver os mesmos dados em várias vistas com ordenações diferentes. O mesmo acontece com as colunas (campos) da tabela. Em conjunto com o Limitar a visualização dos dados, descrito no parágrafo anterior, estas qualidades constituem a vantagem das bases de dados. Introdução de dados As últimas edições das aplicações para criar folhas de cálculo permitem-lhe desenhar formulários de introdução de dados. Esses formulários são extremamente úteis se os seus dados não puderem ser apresentados convenientemente numa tabela, ⪚, se o texto conter várias linhas ou se todas as colunas não couberem no ecrã. Nesse caso, a forma correcta como a folha de cálculo funciona é problemática. Os campos para a introdução de dados são colocados à vontade na folha de cálculo e, na maior parte dos casos, não são seguros no que respeita à intervenção do utilizador (intencional ou acidental). Relatórios As bases de dados permitem agrupar, limitar e somar os dados numa espécie de relatório. As folhas de cálculo são normalmente impressas na forma de pequenas tabelas, sem um controlo automático completo sobre as divisões das páginas e a disposição dos campos. Programação As aplicações para criar bases de dados contêm normalmente linguagens de programação completas. As bases de dados mas recentes também têm essa capacidade, contudo os cálculos servem para modificar os campos da folha de cálculo e para cópias simples dos dados, independentemente da relevância das regras de integridade mencionadas nos parágrafos anteriores. O processamento dos dados numa folha de cálculo é normalmente feito com uma interface do utilizador gráfica, que poderá atrasar a velocidade de processamento dos dados. As bases de dados são capazes de funcionar em segundo plano, fora das interfaces gráficas. Multi-usos É difícil imaginar um multi-usos de uma folha de cálculo. Mesmo que seja tecnicamente possível, no caso das últimas aplicações, necessita de bastante disciplina, atenção e conhecimento por parte dos utilizadores, o que não pode ser garantido. Uma forma clássica de partilhar dados gravados numa folha de cálculo com outra pessoa é enviar um ficheiro como um todo (usando normalmente o e-mail) ou fornecer uma folha de cálculo pela rede. Esta forma de trabalho é pouco eficiente para os grupos maiores de pessoas - os dados que poderiam ser necessários numa dada altura em particular, poderão estar bloqueados de momento por outra pessoa. Por outro lado, as bases de dados foram desenhadas principalmente com acesso multi-usos e multi-utilizadores em mente. Mesmo o bloqueio mais simples, ao nível de uma linha de uma tabela em particular, é possível, o que permite uma partilha simples dos dados da tabela. Segurança A segurança de uma folha de cálculo ou de secções em particular com uma senha é meramente uma actividade simbólica. Após oferecer um ficheiro de folha de cálculo na rede do computador, todas as pessoas que sejam capazes de copiar o ficheiro, poderão tentar descobrir a senha. Normalmente, não será muito difícil, dado que a senha é guardada no mesmo ficheiro que a folha de cálculo. As funcionalidades para bloquear a edição ou a cópia de uma folha de cálculo (ou parte dela), são normalmente fáceis de quebrar. As bases de dados (excepto as gravadas num ficheiro em vez de um servidor) não necessitam de estar disponíveis num único ficheiro. Irá aceder a estas com a rede do computador, normalmente indicando um utilizador e uma senha. Irá ganhar acesso apenas àquelas áreas (tabelas, formulários ou mesmo colunas e linhas seleccionadas) que lhe tenham sido atribuídas, através dos direitos de acesso apropriados. Os direitos de acesso poderão afectar a capacidade de edição dos dados ou apenas da leitura de dados. Se não estiverem quaisquer dados disponíveis para si, poderá até nem ser enviado para o seu computador, como tal não há possibilidade de fazer uma cópia dos dados de forma simples, como acontece nas folhas de cálculo. Desenho da Base de Dados O desenho de uma base de dados necessita de um planeamento cuidadoso. Lembre-se que a nova organização da tabela de contactos, proposta na secção 1.2, poderá gerar problemas quando a tabela for preenchida com dados. Por exemplo, se mudar o nome de um campo será uma tarefa simples, mas a divisão do campo Endereço em dois campos separados necessita de trabalho cuidadoso e aborrecido. Para evitar estas situações, volte a pensar no seu projecto de base de dados antes de a criar no seu computador e antes de você e os outros começarem a usá-la. Como tal, se investir algum tempo inicial, irá provavelmente poupá-lo no dia-a-dia. Quem Precisa de uma Base de Dados? Mantenha-se com as folhas de cálculo se: As suas necessidades são limitadas e os seus dados nunca irão crescer para grandes volumes (será que consegue prever isso para agora?) Não for capaz de adquirir a metodologia de construção de bases de dados. Poderá, contudo, considerar requisitar essa tarefa a alguém que saiba ou usar ferramentas mais simples. Se você usar folhas de cálculo complicadas e não tem tempo ou dinheiro para mudar para bases de dados. Pense ou pergunte a alguém se isso não o levará a um beco-sem-saída. Não conte com ferramentas mágicas que iriam transformar a sua folha de cálculo (por melhor que estejam concebidas) numa base de dados. Pense em usar bases de dados se: A sua colecção de dados se expande todas as semanas. Se cria com frequência folhas de cálculo novas, as copia para dentro destas e se sente que o seu trabalho está cada vez mais aborrecido. Nesse caso, o esforço de mudança para bases de dados vale sempre a pena. Poderá criar relatórios e instruções para os quais a vista da folha de cálculo não é adequada. Poderá então pensar em mudar para uma base de dados com janelas de formulários. 'Software' de Criação da Base de Dados Até agora, ainda não aprendeu as características das bases de dados sem entrar em grandes pormenores sobre as aplicações específicas que os desenharam. As primeiras bases de dados que foram criadas em conjunto com os grandes servidores nos anos 60, ⪚, o IBM System/360. Esta não era a altura dos PCs, como tal, essas bases de dados necessitavam de pessoal altamente especializado. Ainda que o 'hardware' dos computadores antigos fosse pouco fiável, fosse extremamente mais lento e tivesse menos capacidade de armazenamento, uma das funcionalidades de bases de dados ainda continua atraente: o acesso aos dados por vários utilizadores na rede. Nos anos 70, os cientistas formaram a teoria das bases de dados relacionais (termos como: tabela, registo, coluna (campo) e relação, entre outros). Na base desta teoria, as bases de dados IBM DB2 e Oracle foram criadas, sendo desenvolvidas e usadas até hoje. Na última parte dos anos 70, foram construídos o primeiros PCs. Os seus utilizadores poderiam (gradualmente) usar vários tipos de aplicações, incluindo as usadas para a construção da base de dados. No que respeita a bases de dados empresariais grandes, a situação não mudou: continuam a pedir computadores poderosos ou complexos de computadores chamados clusters. Isto vai, porém, além do tópico deste manual. Na área de bases de dados acessíveis, com interfaces gráficas para PCs, poderá escolher o seguinte: DBase - uma ferramenta para operar em bases de dados para DOS, popular nos anos 80. Os ficheiros no formato do DBase ainda hoje são usados em alguns casos específicos, devido à sua simplicidade. FoxPro - uma aplicação semelhante ao DBase (início dos anos 90). Após terem sido adquiridas pela Microsoft, as interfaces gráficas foram introduzidas e, como tal, é usada para criar bases de dados nos PCs. Este produto ainda é oferecido, ainda que esteja um pouco obsoleto. Microsoft Access - uma aplicação para bases de dados (dados e desenho gráfico da interface) com muitas simplificações, o que o torna adequado para principiantes; foi desenhada no fim dos anos 80, baseada na arquitectura de 16 bits. Os produtos oferecidos ainda são usados nos dias de hoje, especialmente nas empresas pequenas, onde a eficiência e os requisitos multi-utilizador não são muito importantes. FileMaker - uma aplicação conhecida e semelhante ao MS Access no que respeita à simplicidade, a operação em plataformas Windows e Macintosh, que é oferecida desde 1985. &kexi; - uma aplicação multi-plataforma (Unix/Linux, Windows, Mac OS X), desenhada em 2003, desenvolvida de acordo com os princípios OpenSource, parte do projecto global que é o Ambiente de Trabalho K, &ie; um ambiente gráfico para os sistemas Unix/Linux. Uma contribuição significativa para o desenvolvimento do &kexi; é a companhia OpenOffice Polónia.