Return to article

Обзор датасета TAWOS для анализа трудозатрат и процессов разработки ПО

Таблица 1 - Сущности, составляющие датасет TAWOS

Название сущности

Назначение

Issue

Основная сущность, хранящая различные извлеченные, производные и вычисляемые характеристики каждой задачи.

Comment

Содержит каждый комментарий, написанный к задаче, включая время создания и идентификатор автора комментария. Персональные данные заменены тегами.

Change_Log

Хронологически упорядоченные изменения атрибутов задач. Каждая запись содержит предыдущее и новое значение атрибута.

Issue_Components

Промежуточная таблица, связывающая задачи и компоненты (связь многие-ко-многим).

Component

Хранит информацию о компонентах, из которых состоит каждый программный продукт.

Issue_Links

Содержит связи между задачами, которые указывают на их взаимосвязь (например, дублирование, зависимость или блокировка).

User

Содержит уникальных пользователей, которые взаимодействовали с проектами в наборе данных. Идентификатор пользователя сгенерирован БД и не связан с ID в исходном репозитории.

Affected_Version

Промежуточная таблица, связывающая задачи с версиями, в которых была обнаружена ошибка или проблема.

Fix_Version

Промежуточная таблица, связывающая задачи с версиями, в которых функция была исправлена какая-либо ошибка.

Version

Хранит информацию о версиях разрабатываемого ПО (имя, описание, дата выпуска).

Project

Хранит информацию о проектах, включенных в базу данных.

Repository

Хранит информацию о репозиториях, включенных в базу данных.

Sprint

Хранит информацию о спринтах (итерациях) в процессе разработки, включая состояние, даты начала и окончания.