Cel: Retrospektywna ocena zmienności międzyobserwacyjnej między radiologami piersi przy użyciu terminologii czwartej edycji Breast Imaging Reporting and Data System (BI-RADS) do kategoryzacji zmian w mammogramach i sonogramach oraz retrospektywne określenie pozytywnej wartości predykcyjnej (PPV) kategorii 4a, 4b i 4c BI-RADS.
Materiały i metody: Uzyskano zgodę Institutional Review Board; świadoma zgoda nie była wymagana. Badanie było zgodne z przepisami HIPAA. Dziewięćdziesiąt cztery kolejne zmiany u 91 kobiet, u których wykonano biopsję sterowaną obrazem, obejmowały 59 mas, 32 zwapnienia i trzy masy ze zwapnieniami. Pięciu radiologów dokonało retrospektywnego przeglądu tych zmian. Każdy z obserwatorów opisał każdą zmianę zgodnie z terminologią BI-RADS i przypisał jej ostateczną kategorię BI-RADS. Zmienność międzyobserwacyjna została oceniona za pomocą statystyki Cohen kappa. Diagnoza patologiczna była dostępna dla wszystkich 94 zmian; 30 (32%) było złośliwych, a 64 (68%) łagodnych. Analizę patologiczną zmian łagodnych przeprowadzono na tkance uzyskanej za pomocą obrazowej biopsji rdzeniowej. W przypadkach skierowanych do biopsji wycięcia po biopsji igłowej z powodu atypii lub rozbieżności, wykorzystano ostateczną chirurgiczną analizę patologiczną w celu korelacji z wynikami badań obrazowych. PPV dla zmian kategorii 4 lub 5 określono łącznie dla wszystkich czytelników.
Wyniki: W przypadku deskryptorów ultrasonograficznych (US) uzyskano znaczną zgodność dla orientacji, kształtu i granicy zmiany (kappa = 0,61, 0,66 i 0,69, odpowiednio). Umiarkowaną zgodność uzyskano dla marginesu zmiany i tylnych cech akustycznych (kappa = 0,40 dla obu). Słaba zgodność została uzyskana dla wzoru echa zmiany (kappa = 0,29). W przypadku deskryptorów mammograficznych umiarkowaną zgodność uzyskano dla kształtu masy, jej marginesu i rozmieszczenia zwapnień (kappa = odpowiednio 0,48, 0,48 i 0,50). Dość dużą zgodność uzyskano dla opisu zwapnień (kappa = 0,32). Niewielką zgodność uzyskano dla gęstości masy (kappa = 0,18). Uzyskano dobrą zgodność w zakresie kategorii oceny końcowej (kappa = 0,28). Wartości PPV dla kategorii 4 i 5 BI-RADS były następujące: kategoria 4a – 6 (6%) ze 102; kategoria 4b – 17 (15%) ze 110; kategoria 4c – 48 (53%) z 91; kategoria 5 – 71 (91%) z 78.
Wnioski: Zgoda międzyobserwacyjna z nową terminologią BI-RADS jest dobra i waliduje leksykon amerykański. Podkategorie 4a, 4b i 4c są przydatne w przewidywaniu prawdopodobieństwa złośliwości.