TOLERÂNCIA A FALTAS DISTRIBUÍDA
Licenciatura e Pós-Graduação em Informática,
2005/2006
- 1 Semestre
Livros adoptado
- Rachid Guerraoui and Luís Rodrigues
- Introduction to Reliable Distributed Programming
- Livro em preparação
- Rascunho disponível em formato pdf.
- Nota importante: este rascunho está inacabado e pode conter
erros. Não deve ser distribuído a terceiros.
Livros aconselhados
- Paulo Veríssimo and Luís Rodrigues
- Distributed System for System Architects
- Kluwer Academic Publishers
- ISBN 0-7923-7266-2
Bibliografia adicional (livros)
- Jean-Claude Geffroy and Gilles Motet
- Design of Dependable Computing Systems
- Kluwer Academic Publishers, 2002.
- ISBN: 1-4020-0437-0
- A. Tanenbaum and Maarten van Steen
- Distributed Systems: Principles and Paradigms
- Prentice Hall, 2002.
- ISBN: 0-13-088893-1
- G. Coulouris and J. Dollimore and T. Kinderberg
- Distributed Systems, Concepts and Design, Third Edition
- Addison-Wesley, 2001.
- ISBN: 0-201-61918-0
- R. Chow and T. Johnson
- Distributed Operating Systems & Algorithms
- Addison-Wesley, 1997.
- ISBN 0-201-49838-3.
- K. Birman
- Building Secure and Reliable Network Applications
- Manning, 1997.
- Disponível em formato pdf
- M. Singhal and N. Shivaratri
- Advanced Concepts In Operating Systems
- Distributed, Database and Multiprocessor Operating Systems
- McGraw-Hill, 1994
- 0-07-057572-X
- P. Jalote
- Fault Tolerance in Distributed Systems
- Prentice Hall, 1994.
- S. Mullender, editor
- Distributed Systems, 2nd Edition
- ACM-Press. Addison-Wesley, 1993.
Introdução ao LaTeX (em Português)
- Pedro Quaresma de Almeida
- Introdução ao LaTeX
- Escolar Editora
- ISBN: 972-592-091-0.
Outros artigos úteis
- The Many Faces of Consensus in Distributed Systems
- John Turek and Dennis Shasha
- IEEE Computer, Volume 25 , Issue 6 (June 1992).
- Disponível em formato pdf
- Mostra que do consenso não demos nem da missa a metade!
- A survey of rollback-recovery protocols in message-passing systems
- E. N. (Mootaz) Elnozahy, Lorenzo Alvisi, Yi-Min Wang, David B. Johnson
- ACM Computing Surveys (CSUR),Volume 34 , Issue 3 (September 2002)
- Disponível em formato pdf
- Um bom survey sobre checkpointing com 14 (!) páginas de
referências para trabalho relacionado!
- Atomic Broadcast in Asynchronous Crash-Recovery Distributed Systems and its use in Quorum-Based Replication
- L. Rodrigues and M. Raynal.
- IEEE Transactions on Knowledge and Data Engineering. September/October 2003 (Vol. 15, No. 5), pp. 1206-1217.
- Disponível em formato pdf
- O artigo que serviu de base à aula teórico-prática sobre o modelo
falha-recuperação.
Alguns artigos sobre aplicações
- RS/6000 Cluster Technology: Group Services Programming Guide and Reference
- IBM
- Disponível pdf
- Nota: Serviços de gestão de grupos para cluster IBM.
- The software architecture of a SAN storage control system
- Glider, Fuente, Scales
- IBM Systems Journal, Vol 42, N 2, 2003.
- Disponível pdf
- Nota: A utilização do consenso e da máquina de estados
replicada no contexto dos sistemas de armazenamento
de dados em rede.
- Faul Tolerant CORBA Specification V1.0
- OMG
- Disponível pdf
- Nota: o nome diz tudo.
Luís Rodrigues