排除 Team Foundation Server 故障时记录和评估结果

更新:2007 年 11 月

本主题提供有关记录 Team Foundation 服务器所发生的更改以及评估这些更改结果的指南。

记录和评估结果

通过保留所有已完成工作的准确完整的记录,可以增加排除故障时所收集的信息的价值。利用记录,可以减少多余工作,通过采取预防措施可以避免以后出现相应问题。

创建配置管理数据库来保存更改的历史记录,这些更改包括安装软件和硬件、更新驱动程序、更换硬件和更改系统设置等。定期验证、更新和备份这些数据,可以防止出现永久丢失问题。若要最大限度地利用数据库,请记录以下细节:

  • 所执行的更改。

  • 执行更改的时间和日期。

  • 执行更改的原因。

  • 执行更改的用户。

  • 更改对系统稳定性或性能的正负面影响。

  • 技术支持所提供的信息。

在计划此数据库,确定要跟踪哪些项或属性时,请考虑整体与细节平衡的需要。

安装新的硬件或软件后,请更新基线信息,以便对以前和当前的行为或性能水平进行比较。如果以前的基线信息不可用,请使用系统信息、设备管理器、性能工具或行业标准基准生成数据。

通过将基线与以前保留的记录相结合,您可以总结所获得的经验、评估维护工作并判断故障排除的有效性。对这些数据进行分析可为故障排除手册打下基础,也可以促使您的组织改变管理策略。

故障排除后的检查或事后调查分析可帮助您确定需要改进的故障排除区域。在此自我评估阶段,您可能需要考虑下面一些问题:

  • 哪些更改起到了改善作用?

  • 哪些更改使问题恶化?

  • 系统性能是否恢复到预期水平?

  • 哪些工作是冗余的或不必要的?

  • 技术支持资源的使用效率如何?

  • 哪些未用到的工具或信息可能会有所帮助?

  • 哪些未解决的问题需要进一步的根源分析?

编写行动计划

行动计划是一组符合组织配置和管理策略的相关故障排除目标和策略。确定问题并找到已在一台或多台计算机上经过测试的潜在解决方案或变通方法后,应制定一个行动计划。与受影响区域的主管和工作人员协调您的计划,以便提前通知他们并确定该计划不会与重要活动发生冲突。计划的内容可包括在非高峰工作时间进行故障排除,或在若干天内分阶段实施工作。评估您的计划,如果发现不足,应对其进行更新以提高其效率和有效性。

随着用户数量的增加,中断也会增加,因此可能降低生产率。您的计划必须考虑这些情况,并允许进行紧急更改。在应变计划中要考虑到无法预料的情况。

请参见

概念

采取主动措施以帮助排除 Team Foundation Server 故障