Validation of Six-Minute-Walk Distance as a Surrogate

DOI: 10.1161/CIRCULATIONAHA.112.105890
Validation of Six-Minute-Walk Distance as a Surrogate Endpoint in
Pulmonary Arterial Hypertension Trials
Running title: Gabler et al.; Validation of 6MWD in PAH trials
Nicole B. Gabler, PhD, MPH, MHA1; Benjamin French, PhD1,2 ; Brian L. Strom, MD, MPH1,2 ;
Harold I. Palevsky, MD3,4 ; Darren B. Taichman, MD, PhD3,4 ; Steven M. Kawut, MD, MS1,3,4;
Scott D. Halpern, MD, PhD1,2,3,4
1
Center for Clinical Epidemiology & Biostatistics and Dept of Biostatistics & Epidemiology;
Leonard
Le
eon
onar
ardd Davis
ar
Davi
Da
v s In
Institute
nst
s itute of Health Economics; 3Pu
Pulmonary, Allergy,
Aller
ergy, and
and Critical Care Division;
4
Pulmonary
Pul
Pu
lm ry Vascular
lmonar
Vasc
scul
ular
ar Disease
Dis
isea
easee Program
Pro
P
rogr
gram
am of
of the
the Penn
Penn Cardiovascular
Caard
rdio
iova
v sccul
ulaar
ar Institute,
Ins
nsti
tittutee, Perelman
Pere
Pe
relm
lman
an School
Sch
S
choo
ooll of
Medi
Me
dici
di
cine
ci
ne, Un
ne
Univ
iv
ver
ersi
sitty ooff P
ennnsylvvan
vania,
nia,, P
hila
hi
l de
la
dellph
lphiaa, PA
A
Medicine,
University
Pennsylvania,
Philadelphia,
2
C
Correspondence:
orrespond
nden
ence
ce::
Ni
Nicole
l B.
B Gabler,
G bl PhD
Perelman School of Medicine
University of Pennsylvania
708 Blockley Hall
423 Guardian Drive
Philadelphia, PA 19104-6021
Tel: 215-573-0779
Fax : 215-573-5315
E-mail: [email protected]
Journal Subject Codes: [18] Pulmonary circulation and disease; [26] Exercise/exercise
testing/rehabilitation; [100] Health policy and outcome research
1
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Abstract:
Background - Nearly all available treatments for pulmonary arterial hypertension (PAH) have
been approved based on change in six-minute-walk distance (¨6MWD) as a clinically important
endpoint, but validity as a surrogate endpoint has never been shown. We aimed to validate the
difference in ¨6MWD against the probability of a clinical event in PAH trials.
Methods and Results - First, to determine if ¨6MWD between baseline and 12 weeks mediated
the relationship between treatment assignment and development of clinical events, we conducted
a pooled analysis of patient-level data from the ten randomized placebo-controlled trials
previously submitted to the U.S. Food and Drug Administration (n=2404). Second, to identify a
threshold effect for the ¨6MWD that indicated a statistically significant reduction in clinical
g
g 21 drug/dose
g
events,, we conducted a meta-regression
among
level combinations. ¨6MWD
h m
he
etaet
aaccounted for 22.1% (95% CI: 12.1%, 31.1%) of the treatment effect (p<0.001).. T
The
metaanalysis showed an average difference in ¨6MWD of 22.4 m (95% CI: 17.4 to 27.5), favoring
y of a clinical event
active treatment over placebo. Active treatment decreased the probability
sum
umma
mary
y OR:
OR: 0.44;
0.4
.44;
4; 95%
5% CI:
CI: 0.33,
0.333, 0.57).
0.557)). Thee meta-regression
met
etaa-regr
gres
e sion revealed
rev
e eaale
ledd a significant
sign
gnif
i icantt threshold
thre
th
reshold
(summary
efffeect
c of 41.8 m
eters.
s.
effect
meters.
Conc
Co
ncclu
usionss - O
ur results
ressullts suggest
re
suugg
ges
est that
thatt ¨
6M
MWD
WD does
does not
noot explain
explai
plainn a large
larrge proportion
prrop
opor
ortion
on of
of the
th
he
Conclusions
Our
¨6MWD
reaatm
tmentt effect,
effect
ef
ct, has
has only
o ly
on
y modest
mod
odes
e t validity
v lidiity as
va
as a surrogate
surrog
su
gat
atee en
endp
dpoi
o ntt ffor
or cclinical
linic
icall eevents,
vents,, aand
ve
ndd m
a nnot
ay
o
treatment
endpoint
may
be a sufficien
en
nt su
surr
rrog
rr
oggat
a e en
ndp
dpoi
oint
ntt. F
urrth
ther
er rresearch
esea
es
earc
ea
rchh is
i nnecessary
eces
ec
esssar
aryy to
o ddetermine
eter
et
ermi
er
mine
mi
ne whether
whe
w
heth
he
ther
th
er the
sufficient
surrogate
endpoint.
Further
threshold value of 41.8 m is valid for long-term outcomes or if it differs among trials using
background therapy or lacking placebo controls entirely.
Key words: hypertension, pulmonary; meta-analysis; statistics; trials
2
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Introduction
Pulmonary arterial hypertension (PAH) is a progressive disease leading to right heart failure and
death.1-2 Seven drugs developed in the last 20 years have been shown to improve six-minutewalk distance (6MWD) in patients with PAH and have been approved for use in the U.S. on that
basis. While 6MWD is viewed by regulatory agencies as a clinically important endpoint in its
own right, several studies have shown that patients who achieve greater improvements in 6MWD
(or reach certain absolute values of 6MWD) have better clinical outcomes.3-5 However, such
observational data are insufficient to determine whether 6MWD is a valid surrogate endpoint for
clinical events.6-9
Determining the validity of 6MWD as a surrogate endpoint in PAH trials
ls iiss pa
part
particularly
rttic
icul
ular
ul
a ly
ar
timely
imely in light of conflicting results of recent meta-analyses.10-13 While some of these
co
ont
ntra
radi
ra
dict
di
ctio
ct
ions
io
ns may
may be
b due to inadequate samplee size
size or follow-up,
follow-upp, or tto
o in
iintrinsic
trinsic limitations of
contradictions
study-level
tud
dyy level meta-analyses,
meta
me
taa-aanaaly
lyse
sees,
s these
tthe
hese
he
se differences
difffe
ferrenncess also
also suggest
suggeest
st the
tthhe possibility
posssiibi
bili
liity that
tha
hatt 6WMD
6WMD is
is a poor
poor
poo
or
14-17
4-1
17
surrogate.
urr
rrog
ogat
og
a e. In tthi
at
this
his stud
sstudy,
tud
dy, w
we uused
sed ttwo
wo ccomplementary
om
mpl
plem
men
ntaary aapproaches
ppro
pp
roac
ro
acche
hes to vva
validate
alid
id
dat
atee 6M
6MWD
6MWD.
WD.14
WD
First,
F
Firs
i st,
patiien
ntt leeve
vell data
da from
fro
om all
all available
a ai
av
aila
labl
la
blee Phase
bl
Phas
Ph
asse III
III randomized
raand
ndom
omiz
om
ized
iz
e clinical
cliini
nica
call trials
ca
ttri
rial
a s submitted
al
subm
su
bmitted for
bm
we used patient-level
drug approval to assess whether changes in 6MWD ('6MWD) mediate the relationship between
treatment assignment and clinical outcomes. Second, we quantified how treatment effects on
'6MWD predicted treatment effects on patient-centered outcomes, with the goal of determining
whether a threshold '6MWD exists beyond which investigators could reliably predict that
superior clinical outcomes would follow in future trials.
Methods
Study Population
Through a contract with the U.S. Food and Drug Administration (FDA) to one author (SDH), we
3
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
obtained de-identified individual patient data for all participants in Phase III placebo-controlled
randomized trials submitted to the FDA through 2008 testing prostanoids, endothelin receptor
antagonists, or phosphodiesterase inhibitors. Eleven clinical trials examined seven agents
(ambrisentan, bosentan, sitaxsentan, iloprost, treprostinil, sildenafil, and tadalafil). We excluded
one study (BREATHE-2) because it only included 33 participants and was not a Phase-III trial.
Additional trial details are available elsewhere.18-25 We purposely included trials of treatments
that were not approved by the FDA (e.g., sitaxsentan), a result of either unacceptable toxicity of
effective dosages or dosages that were determined to be ineffective. Both the mediator and
threshold analyses would be predictably biased if we only included FDA-approved treatments,
and the resulting conclusions would not be useful for future trial design orr regulatory
regullator
at ry decisions.
deci
de
cisi
ci
sion
si
o s.
on
s
All included trials reported similar methodology, including outcome assessment and variable
co
olllec
ecti
tion
ti
on
n at
at 112-weeks
2-w
-w
weeks
ee follow-up.
collection
C
lin
nic
i al events
event
ntss
Clinical
Cl
lin
inic
ical
ic
a eeve
al
vent
ve
n s in
nt
nclud
cluded
ed
d aany
ny ooff th
thee foll
ffollowing
olllow
wing
ng bbefore
efoore
ef
ore th
he en
endd of th
he tr
tria
iaal: ddeath,
eaath
th,, lu
lung
ng
Clinical
events
included
the
the
trial:
ransplantatio
on,
n atrial
aatr
tria
tr
iaal septostomy,
sept
se
p os
osto
tomy
to
my,, ho
my
hosp
pit
i al
aliz
izzat
atio
io
on du
duee to
o worsening
woors
w
r en
enin
i g PA
in
PAH,
H, w
wit
ithd
hdra
hd
rawa
ra
wall for
wa
transplantation,
hospitalization
withdrawal
worsening right-heart failure, or addition of other PAH medications. We did not consider a
deterioration in 6MWD to represent a clinical event because it was the surrogate we were
attempting to validate. Further details are provided in the Supplemental Material, Table 1.
6MWD
Change in 6MWD was calculated as the difference, in meters, between the distance walked at
baseline and 12 weeks. Baseline 6MWD was recorded at or within two weeks of randomization.
In all analyses, patients who were missing a 12-week 6WMD because they died during the trial
(n=45, 2%) were assigned a value of 0. We chose this value to reflect the fact that deaths are
4
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
extremely important clinical events and also to be consistent with the metric used in the majority
of the trials included in our analysis. We used multiple imputation26 to designate values for
patients who survived but were nonetheless missing 12-week 6MWD (n=182, 8%). The
imputation model included variables associated with clinical events: baseline 6MWD, age,
gender, weight, race, height, diagnosis category (idiopathic, connective tissue disease, HIV
infection/anorexigen use, or congenital heart disease), 6MWD at 4 or 6-weeks follow-up, NYHA
functional classification, warfarin use, baseline sodium, cardiac output, and mean pulmonary
arterial pressure. Five datasets were imputed. All imputations were completed in SAS version
9.2.27
Mediator Analysis
We utilized standard methodology to determine whether '6MWD mediates the relationship
between
treatment
events
beetw
twee
eenn trea
ee
tr
rea
e tmen
tmen
nt as
aassignment
signment and the development
developm
men
e t of clinical ev
ven
e tss aatt 12
112-weeks
-weeks follow-up.15-16
We defined
d
treatment
tre
reat
attment
nt assignment
asssig
ssignm
nmen
nm
entt as either
eithher active
acttive treatment
trreatm
tm
men
entt or
or placebo.
pllaccebo
bo.. W
Wee cond
cconducted
ondducte
ucte
t d re
regression
egr
greesssion
analyses
anal
an
alys
al
yses
ys
es to
to ev
eevaluate
val
aluuate
uate tth
the
he ffour
he
our fo
ou
ffollowing
llow
ll
owin
ow
ingg hy
hypo
hypotheses.
poth
po
hes
e es. Re
Reje
Rejecting
ject
je
ctiing
ct
ing th
the
he nu
null
lll for
or aall
ll ffour
ourr hypo
ou
hhypotheses
ypo
poth
hes
esees
was necessary
necessar
arry to support
sup
uppo
p rt
po
r '6MWD
'6M
6MWD
WD as
as a mediator/surrogate
medi
me
d at
di
a or
or/s
/sur
/s
urro
ur
r ga
ro
gate
tee end
end point.
poi
oint
nt..
nt
(1) Treatment assignment has a significant effect on '6WMD from baseline to 12 weeks;
(2) '6MWD has a significant effect on the odds of developing a clinical event;
(3) Treatment assignment has a significant effect on the odds of developing a clinical event;
(4) The effect of treatment assignment on the odds of developing a clinical event is
attenuated when '6MWD is added to the model.
We used logistic or linear regression for binary or continuous outcomes, respectively.
All regression models adjusted for study to account for study-level differences in treatment
assignment, and for baseline walk distance to account for patient-level differences in risk of
5
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
clinical events. No other adjustments were made because patients were randomly assigned to
treatment or placebo.
After rejecting the null for the above four hypotheses, we determined the proportion of
variability explained by the '6MWD in the relationship between treatment assignment and
development of a clinical event.28-29 We used a generalized linear model with a logit link to
quantify the relationship between treatment assignment and log odds of developing a clinical
event with adjustment for study and baseline walk (‘reduced’ model). We then added the
'6MWD to the model (‘full’ model). The subsequent change in the treatment assignment
coefficient between the reduced and full models provided the proportion of variability explained
by '6MWD. Bootstrap resampling was used to create a confidence interval for tthe
he pper
percent
erce
er
cent
ce
nt
change. Estimates of percent change were obtained for each resampled dataset, and the standard
deviation
devviat
de
viat
atio
ion of the
tthhe estimates
est
stim
i ates across 1000 resampled
resampl
p edd datasets
datasets was used
use
seed as the
tthhe
he standard error.30
dit
itio
io
on, wee uused
sed
ed a m
oddif
ifie
ied
dS
obeel testt tto
o ass
sssesss whet
w
h theer th
he amou
aamount
mountt off m
eddiaatio
a ti n w
as
In add
addition,
modified
Sobel
assess
whether
the
mediation
was
statistically
tat
atis
isti
is
tica
ti
call
ca
llyy si
ll
sign
significant;
gn
nif
ific
ican
ic
ant;
an
t; the
the
h m
modified
odiifi
od
fieed
ed ttes
test
estt ac
es
acco
accounted
coun
co
unte
un
tedd fo
te
forr th
thee fa
fact
ct tthat
hatt th
ha
thee su
surr
surrogate
r og
ogat
atee (c
at
(con
(continuous)
onnti
tinu
nuou
nu
ous)
ou
s)
3
outccom
omee (b
(bin
inar
in
a y)
ar
y w
ere onn ddifferent
er
i feere
if
rent
n ssca
nt
cale
ca
les.
le
s.16, 31
We eevaluated
valu
va
l atted tthe
lu
he aassumption
ssum
ss
umpt
um
ptio
pt
ionn of no effec
io
effect
ct
and the outcome
(binary)
were
scales.
modification between treatment and the mediator31 by fitting a logistic regression model for
clinical events with an interaction term between treatment assignment and '6MWD.
Threshold Effect Analysis
We then conducted a trial-level meta-analysis and meta-regression to assess the relationship of
the treatment effect on the mediator ('6MWD) with the treatment effect on the odds of
developing a clinical event at 12-weeks follow-up. This threshold analysis proceeded in four
steps.
First, we estimated values for the exposure variable, placebo-adjusted study-level
6
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
'6MWD, by conducting linear regressions within each trial. In these trial-specific patient-level
regressions, the exposure variable was treatment (drug and dose), entered as indicator variables
(with placebo as the referent). The outcome variable was '6MWD, and adjustment again was
made for baseline 6WMD.
Second, we estimated values for the outcome, the placebo-adjusted study-level log odds
of developing a clinical event between baseline and 12-weeks, using logistic regression analyses
within each trial. In these trial-specific patient-level regressions, treatment (drug and dose,
entered as indicator variables with placebo as the referent) was the exposure, clinical event (yes
or no) was the outcome, and adjustment was made for baseline 6MWD. Exact logistic
regression
egression was used when the number of clinical events in a study was small.
Third, we used the 21 drug/dose combinations vs. placebo across trials in a fixed-effects
meta-regression
relating
'6MWD
meeta
ta--reg
-re re
ress
s ionn re
ss
rela
lating
g estimated difference in '
6MWD to the estimated
estima
es
matted
ted logg odds ratio for
cllin
cclinical
nic
ical events. The
Th square
sqquare of
of the
th inverse
inveersse standard
inve
sttandarrd error
erro
or was
wa used
useed
ed as a weight
weig
ig
ght to
to account
acccou
count
unt for
f r
fo
uncertainty
estimated
ratio.
threshold
effect
calculating
unce
un
ceert
rtai
aint
ai
ntyy in
nt
in tthe
he eest
stim
st
imat
im
ated
at
e llog
og oodds
ddss ra
dd
ati
tio.
o. We ddetermined
eter
et
ermi
er
mine
mi
nedd th
ne
thee th
hre
resh
shol
sh
oldd ef
ol
effe
fect
fe
ct bby
y ca
alc
lcul
ulat
ul
atin
at
ingg
in
95% prediction
predicti
tiion bands
ban
ands
ds around
aroun
roun
undd the
th
he meta-regression
meta
me
ta-r
-reg
-r
egre
eg
r ss
re
ssio
ionn line.
io
l ne. The
li
The threshold
thr
hres
esho
hoold was
was ccalculated
alcu
al
cula
cu
late
la
tedd aass the valuee
te
of difference in '6MWD where the upper prediction band crossed the null value of 1.0 for
relative odds of a clinical event. Prediction bands quantify the uncertainty in predicting the
difference in clinical worsening in a single trial given a defined difference in '6MWD. Linearity
of the final regression model was assessed via standard regression diagnostics.
Finally, we sought to determine whether study-level patient characteristics confounded
the association between '6MWD and relative odds of clinical events. Potential confounders
were chosen a priori based on known differences in treatment response by race and sex,32 and by
diagnosis and NYHA functional classification.33 Therefore, covariates in our regression model
7
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
were race (% black), sex (% female), PAH diagnostic category (% connective-tissue related), and
NYHA functional classification (% III or IV). If a potential confounder altered the coefficient
for the treatment variable by 10% or more, it was retained in the final model.
We conducted two secondary analyses. First, we excluded the PHIRST study, in which
patients were permitted to use background therapy with other approved PAH-specific agents.
Second, we removed patients who were New York Heart Association (NYHA) class IV at
randomization since it is unlikely that these patients will be included in future clinical trials. All
regressions and meta-regressions were conducted in R version 2.13 (R Development Core Team,
Vienna, Austria).
This study was determined to be exempt by the Institutional Review Board
Boar
arrd of
of the
the
University of Pennsylvania (approval #814001). All co-authors had access to the study data,
take
authority
manuscript
akee responsibility
rres
espo
es
po
ons
n ib
ibilit
itty for
f r the analysis, and had auth
fo
hor
o ity over manusc
sccript
pt ppreparation
re
reparation
and the
decision
publication.
deciisi
deci
s on to submit
suubm
mitt ffor
or pub
ubli
ub
lica
li
cattion
ca
tion..
Results
Resu
Re
sult
su
ltss
lt
The ten trials included 2404 patients; 1563 (65%) were allocated to active treatment.
Participants’ median age was 50 years (range: 10 to 90 years), 22% were male, and 5% were
black (Table 1). Five hundred eighty one patients (25%) had a diagnosis of PAH due to
connective tissue disease and 1349 (57%) were categorized as NYHA classification III or IV.
Forty-five patients (2%) died between baseline and 12-weeks follow-up. An additional 153
patients (6%) experienced other clinical events; 83 of these did not have 12-week walk distance.
Mean baseline walk distance was 341 m (standard deviation: 85.7 m). Demographic,
anthropometric, laboratory, and hemodynamic values were similar between groups defined by
treatment allocation.
8
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Characteristics of the ten trials are presented in Table 2. Study-level percentages of
female patients and patients diagnosed with CTD-related PAH were consistent across studies.
Percentages for NYHA classification III/IV and black race showed more variation across studies.
Does 6MWD mediate the relationship between treatment assignment and clinical events?
The four criteria necessary to establish '6MWD as a mediator of the relationship between
treatment assignment and development of a clinical event are listed in Table 3. For each, we
found a statistically significant result in the required direction. First, assignment to active
treatment vs. placebo led to greater differences in the '6MWD (mean difference in '6MWD:
22.2 m; 95% CI: 15.6 to 28.9 m). Second, greater differences in '6MWD significantly reduced
the
he odds of clinical events at 12-weeks follow-up (OR: 0.89; 95% CI: 0.87 to 0.91)
0.991)
1 for
for
or a tenten
en-meter increase in '6MWD. Third, assignment to active treatment vs. placebo significantly
deecr
creease
eas d th
he re
ela
lati
tive
v oodds
dd
ds off cclinical
linica
li
c l ev
ven
e ts aatt 12
2-weeks
ks ((OR: 0.
0.4
43; 95
95%
% CI
CI: 0.
0.31 too 0.
00.59).
59).
59
)
decreased
the
relative
events
12-weeks
0.43;
F naall
Fi
l y, the effec
ct ooff ttreatment
reaatmeent assi
siign
gnme
ment oon
me
n the ddevelopment
eveelo
lopm
pmennt ooff a clin
pm
niccal eev
vent w
as aattenuated
ttenuuatted
Finally,
effect
assignment
clinical
event
was
with
wiith
h the
the addition
aadd
ddit
dd
itio
io
on of '
'6MWD
6MWD
6M
W to
WD
to the
the model
mo
ode
dell (OR:
(OR
(O
R: 0.52;
R:
0.52;
52;
2 95%
95% CI:
CI 0.37
0 37 to
0.
to 0.73).
0.73
7 ). The
73
The proportion
prop
pr
opor
op
orti
or
tion
ti
on ooff
he effect off treatment
trea
tr
eatm
t en
tm
entt on tthe
h oodd
he
ddds of ddeveloping
evel
ev
elop
opiing
ing a cl
lin
inic
icall eeve
vent
nt att 12 w
wee
eeks
ks tthat
hatt wa
ha
wass expl
p ainedd
the
odds
clinical
event
weeks
explained
by '6MWD was 22.1% (95% CI: 12.1% to 31.1%). Additionally, the modified Sobel test
confirmed the statistical significance of the mediation (Z = 4.77, p<0.001). There was no
significant interaction between treatment and '6MWD (estimate and 95% CI: 0.002 (-0.002,
0.006), p=0.25).
Does a threshold effect exist for '6MWD?
Compared with placebo, nearly all drug/dose combinations resulted in a greater '6MWD at 12weeks follow-up (Table 4). The summary results indicate an average difference in '6MWD of
22.4 m (95% CI: 17.4 to 27.5) for assignment to active treatment relative to placebo. The effect
9
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
on reduction of clinical events was consistent across drug/dose combinations. Relative to
placebo, all 21 drug/dose combinations lowered the odds of developing a clinical event at 12
weeks follow-up (summary OR: 0.44; 95% CI: 0.33 to 0.57).
Figure 1 illustrates the results of our meta-regression and threshold analysis. The upper
prediction interval crossed the null value for relative odds of a clinical event at a difference in
'6MWD of 41.8 meters. This value indicates the minimal summary difference in '6MWD that
corresponds to a statistically significant reduction in clinical events. Models including race, sex,
diagnosis category, and NYHA functional classification showed no evidence of confounding and
these variables were not included in the final meta-regression model.
In a sensitivity analysis, we removed the four
drug/dose combinations from
PHIRST
f
fro
om th
thee PH
PHIR
IRST
IR
ST
study,
tudy, as this study was the only one to allow concomitant background therapy. Excluding this
study
25.7
difference
tud
udyy resulted
resuult
re
lted
ed
d inn a smaller
s aller threshold value of 25.
sm
5.77 m for the differ
erren
e ce iinn '6MWD. In an
additional
analysis,
NYHA
class
change
ad
dditi
dit onal ana
aly
lyssiss, rremoving
emov
ovin
ingg NYH
N
YHA cl
cla
ass IV patients
pattieentss (n=127)
(n=
(n
=127)
=12
27) did
did not
noot appreciably
apprrecia
iabl
blly ch
chan
ange
an
ge
results.
Further
details
provided
esuult
lts.
s Fu
s.
Furt
rthher
rt
her de
eta
tail
ilss ar
il
aree pr
rov
o id
ided
ed iin
n th
thee Supplemental
Supp
Su
ppllem
pp
lement
ment
n al Material.
Mat
M
ater
at
erria
iall.
Discussion
This study provides the first rigorous examination of the validity of '6WMD from baseline to 12
weeks as a surrogate endpoint in trials of PAH therapies. '6MWD met all criteria as a mediator
of the relationship between treatment and development of a clinical event at 12 weeks. However,
the proportion of this relationship explained by 6MWD was modest at 22%, suggesting that
6MWD may not be an adequate surrogate. A threshold effect of 41.8 meters was also identified,
meaning that if a drug improved 6MWD over 12 weeks by 41.8 meters more than did placebo,
investigators could predict, with 95% confidence, that the drug would reduce the in clinical event
10
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
rate over 12 weeks.
We found that only 4 of the 21 drug-dose combinations produced effects on '6MWD that
could be said, with conventional degrees of certainty, to be associated with clinical
improvements (Figure 1). If the lower threshold value of 25.7 m is used, then 5 of the remaining
17 drug-dose combinations would be considered to produce statistically significant effects on
clinical outcomes in the absence of background therapy. Of these 9 total drug-dose combinations
that met the lower threshold value, one involved a drug that is not approved by the FDA
(sitaxsentan) and two involve dosages that are not included in FDA labeling (sildenafil 40 mg
TID and sildenafil 80 mg TID). Three drugs (iloprost, tadalafil, and treprostinil) did not meet
either of the threshold values.
It is essential to explore the validity of surrogate endpoints because valid surrogates
provide
efficient
studies
prrov
ovid
idee ef
id
effi
fici
fi
cien
ci
nt mechanisms
me
for early phase stu
udiees of new interventions.
interrve
v nttio
ionns.
ns Specifically, trials
utilizing
validated
surrogate
endpoints
conducted
more
quickly,
sample
utiliizing
iz
valida
date
teed su
urrog
gat
atee en
ndp
dpoi
oinnts
oi
nts ccan
an bbee con
nducteed mor
ndu
m
ore
re qqui
uick
ckly
y, with
wi h ssmaller
mall
ma
ller
ll
err ssam
ampl
am
plee
sizes,
risks
izees, fewer
few
few
ewer
er rris
isks
ks to
to subjects,
suubjjec
ects, and
and reduced
redu
re
duce
cedd research
ce
reseear
re
a ch
ch ccosts
osstss tha
tthan
hann trials
ha
t iaalss that
tr
ttha
haat use
use true
true clinical
cli
linnica
nicaal
3
endpoints.34-35
However,
Howe
Ho
weve
we
ver,
ve
r, only
onl
nlyy if surrogate
ssur
urrro
r ga
gate
te endpoints
end
ndpo
poin
po
in
ntss are
aree va
vali
validated
lida
li
date
da
ted wi
te
will
l tthey
ll
heyy cl
he
clearly
lea
earl
rlyy pr
rl
provide thesee
virtues; in the absence of validation, there is considerable risk, as shown famously in the CAST
trial,36 of falsely concluding the effectiveness of a new intervention.
Our data also add to a growing literature on the use of 6MWD as an outcome measure in
other settings. Using different methods, 6MWD has been evaluated in idiopathic pulmonary
fibrosis,37 chronic obstructive pulmonary disease,38 and cardiac rehabilitation.39 In our study, we
found that the proportion of the effect of treatment on preventing clinical events explained by the
change in 6MWD was 22.1%, which falls well below the 50-75% threshold for a valid surrogate
described by Freedman,28 although some consider this an overly stringent criterion.15 Clearly,
11
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
PAH treatments have unmeasured effects on the outcome that are not fully captured by the
change in 6MWD.40 Thus, the finding of true but modest mediation by 6MWD suggests that it
may not be sufficient to use on its own. Incorporation in a combination surrogate measure with
hemodynamic or other assessments might improve its performance and warrants further study.
The threshold value we identified of 41.8 meters for the difference in '6MWD may be
considered for use as the level of improvement in '6MWD necessary to reliably conclude that
the intervention will confer clinical benefits in future trials. Using different methods and patients
from a single study (the SUPER study), Gilbert et al. estimated a minimally clinically important
difference of 41 m that correlated with patient-reported improvement.41 Similarly, in untreated
PAH patients, Paciocco et al. found that each increase in 50 m walked was associ
associated
ciiat
ated
ed w
with
ithh an
it
an
18% reduction in mortality.42 The consistency of findings across these studies using different
methods
me
eth
thoods
od supports
suupp
pporrts the
th robustness of this result. However,
How
owever, '6MWD
D rem
remains
mai
ain
ins an inadeq
inadequate
quate
surrogate
urrrog
o ate endpoi
endpoint
oiintt giv
given
iv
ven
n the
hee m
modest
oddes
estt ddegree
egree ooff me
mediation
ediatio
ionn of
io
of tthe
h ttreatment
he
reeatm
ment eeffect.
ffeect.
ff
t
Confidence
Conf
Co
nfid
nf
iden
ence
en
ce iinn ou
ourr rresults
esu
suult
ltss st
stem
stems
emss fr
from
om tthe
h llarge
he
argge sa
ar
samp
sample
mple
mp
le ssiz
size
izze em
empl
employed
ploy
pl
oyed
oy
ed
d aand
nd tthe
he ffact
he
actt that
ac
that the
the
h
treatment
reatment effects
efffe
fect
ctss on changes
ct
ccha
hang
ha
nges
es in
in 6MWD
6MWD and
and on
on clinical
clin
cl
in
niccal
a eevents
vent
ve
ntss w
nt
were
eree ccon
consistent
onsi
on
sist
si
sten
st
entt ac
acro
across
r ss all drug
ro
doses.43 Nonetheless, this study has limitations. First, as with any meta-analysis, the findings are
subject to errors in the conduct, data entry, or analysis of the primary data. Second, these primary
trials included mostly women and whites, and used relatively short follow-up periods. We are
unable to evaluate clinical endpoints that occur after 12 weeks and our results should not be
generalized beyond this time period. However, the demographics represented are consistent with
the broader epidemiology of PAH, and the included trials all provided similar follow-up, clinical
event definitions, and outcome measurement, making them well suited for our meta-analytic
approach.
12
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
All of the trials that we examined were placebo-controlled, which is an additional
strength. However, one allowed concomitant background therapy. Removal of the PHIRST trial
reduced our threshold value, suggesting that future trials employing background therapies may
be subject to larger threshold values than those reported here. In other words, in the presence of
an effective PAH therapy, an RCT of a new therapy may need to produce larger differences in
the '6MWD to provide confidence that the results correspond to differences in clinical
outcomes. We were unable to further explore the role of background therapy due to small
sample sizes. Future research, therefore, is needed, particularly in light of ethical questions
surrounding the future conduct of placebo-controlled trials in PAH.44
Finally, we used statistical techniques to help address a clinical question. Wh
W
While
ile ou
ourr
threshold
hreshold estimate provides a clear idea of what '6MWD would be needed to indicate that the
benefits
be
ene
nefi
fits
fi
ts off a ttreatment
reaatmen
tme t will be greater than zero,, the
the inference of a “cli
“clinically
lini
niically important”
ddifference
iffference in outcomes
outtcoome
ou
omes might
mig
ighht
ht warrant
war
arra
rannt selection
ra
seelecttio
on off a different
dif
ifffere
fereent threshold.
thrressholld. Individual
Ind
ndiivid
ividua
uall patients
paatieents
ents m
may
ay
show
how
w clinical
ccli
lini
li
nica
ni
call improvement
ca
im
mpr
prov
ovem
ov
emen
em
ent without
en
with
wi
t ouut reaching
th
reaachi
re
achi
hing
ng a cce
certain
ertaain
erta
i '
'6MWD
6MWD
6M
WD threshold
thr
hres
eshhold
hold
d vval
value
alue
al
ue and
and ppatients
atieent
atie
ntss who
who
improve
their
may
clinical
However,
mprove thei
eiir 6M
6MWD
WD m
ay
y nnot
ot nnecessarily
e es
ec
e saari
rily
ly
y eexhibit
xhiibi
xh
bitt cl
clin
i iccal iimprovement.
in
mpro
mp
roveeme
ment
nt. H
nt
ow
wev
ever
e , th
er
the
population-level threshold values we have established are useful in designing future clinical
trials.
In conclusion, we used two complementary approaches to examine the validity of
'6MWD as a surrogate endpoint in clinical trials of PAH therapies. We were able to identify
significant threshold effects of '6MWD that can be used to guide future RCTs, and we found
that '6MWD is a mediator in the relationship between treatment and clinical outcome.
However, because '6MWD does not explain a large proportion of this treatment effect, it may
not be sufficient to use it as a lone surrogate endpoint. Further studies are needed to identify
13
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
combination surrogate endpoints that may have superior characteristics, and to determine if this
threshold value we identified applies to trials employing background therapy or not employing
placebo controls at all.
Acknowledgments: We are grateful to Maximilian Herlim and to Ziyue Liu, PhD, for their
invaluable help preparing the data for analysis and to Dr. Norman Stockbridge and Dr. Salma
Lemtouni at the U.S. Food and Drug Administration for providing us with the data to conduct
this study.
Funding Sources: This work was supported by an American Thoracic Society / Pfizer Research
Grant in Pulmonary Hypertension (Dr. Halpern). Dr. Kawut was supported by K24 HL103844.
Neither the FDA nor the funding source had a role in the design of this study nor in the decision
to submit it for publication. The FDA did review the study prior to submission as a condition of
the original
contract,, but did not request
anyy changes
g
q
g to our text.
Conflict of Interest Disclosures: Dr. Gabler has participated in unrelated projects
project
ctss funded
fund
fu
ndded by
by
Pfizer, Inc. Dr. Strom has served as a consultant for Abbott, Amgen, Astra Zeneca, BMS,
Boehringer
Orexigen,
Boehring
ger Ingelheim, Glaxo, Novartis, NPS Pharma, Nuvo Research, O
rexigen, Pfizer, Teva,
and
Pfizer,
Shire,
an
nd Vivus
Vivvus
Vi
vus an
aandd has
haas funded
f nded research from AstraZeneca,
fu
AstraZe
Zeene
neca, BMS, Pfize
zeer, S
hirre,
hi
re and Takeda. He has
received
contributions
Penn’s
pharmacopeidemiology
training
ece
ceiived
iv con
ntrib
tr but
utio
i ns tto
io
o Pe
Penn
nn’s
’ss ppha
harm
rmac
acop
oppei
eide
dem
mioologgy tr
trai
a ning
ai
ng pprogram
rogr
ro
g am ffrom
gr
rom
ro
m Abbott,
A bo
Ab
bott
ttt, Amgen,
Am
mge
g n,
Hoffman,
H
offfman,
ff
LaR
LaRoche,
Rocchee, N
Novartis,
ova
vart
rtis
rt
iss, Pf
Pfiz
Pfizer,
izzer
er, San
S
Sanofi
anofi
fii P
Pasteur,
asteu
eurr, aand
eu
nd
dW
Wyeth.
yeth
yeth
h. Dr.
Dr. Pa
P
Palevsky
levs
vssky hhas
as rreceived
ecei
ec
e ved
ved
consulting
co
onssul
u ting ffees,
ees, aadvisory
ee
dvisooryy bo
boar
board
arrd fe
fees
fees,
s, sp
speaking
peaking
ng fee
fees
es aand/or
ndd/o
/orr rresearch
essearrch
h fun
funding
ndiing ffr
from
rom Ac
rom
Acte
Actelion,
tellioon,
Bayer,
Ba
aye
yer,
r, G
GeNO,
eN
NO,
O G
Gilead,
ileead
ead,
d, Glaxo,
Gla
laxoo, Pfizer,
Pfiz
Pf
izer
iz
er,, United
er
Unit
Un
ited
it
ed Therapeutics
The
h rap
peu
utiics aand
ndd L
Lun
Lung
unng Rx.
Rx Th
These
hes
e e ro
roles
ole
less in
n nno
ow
way
ayy
impacted
mpa
pact
cted
d onn this
th
his analysis
ana
naly
lysis of
o the
the results
re
of previously
ppre
revi
viou
ouslyy published
publ
pu
blis
ishe
hedd st
studies.
tud
udie
ies.
s Dr
Dr. Ka
Kawu
Kawut
w t ha
has re
rece
received
ceiv
i ed
consulting fees,
fee
eees, advisory
adv
dvis
i or
is
oryy board
boar
bo
ardd fees,
ar
fees
fe
ess, speaking
sppea
eaki
king
ki
ng fe
ffees,
es,, un
es
uunrestricted
reest
stri
r ct
ri
c ed eedu
duuca
cattio
iona
nall gr
na
gran
ants
an
ts,, an
ts
aand/or
d/or
educational
grants,
ese
sear
arch
ch funding
fun
undi
ding
ng from
fro
rom
m Pfizer,
Pfiz
Pf
izer
er Actelion,
Acte
Ac
teli
lion
on Bayer,
Baye
Ba
yerr Ikaria,
Ika
kari
riaa N
ovaart
ov
rtis
is Me
Merc
rckk G
ilea
il
eadd U
nite
ni
tedd
research
Novartis,
Merck,
Gilead,
United
Therapeutics, and Lung Rx. Dr. Taichman has received institutional research funding from
Actelion.
References:
1. Taichman DB, Mandel J. Epidemiology of pulmonary arterial hypertension. Clin Chest Med.
2007;28:1-22.
2. Humbert M, Sitbon O, Chaouat A, Bertocchi M, Habib G, Gressin V, Yaici A, Weitzenblum
E, Cordier JF, Chabot F, Dromer C, Pison C, Reynaud-Gaubert M, Haloun A, Laurent M,
Hachulla E, Cottin V, Degano B, Jais X, Montani D, Souza R, Simonneau G. Survival in patients
with idiopathic, familial, and anorexigen-associated pulmonary arterial hypertension in the
modern management era. Circulation. 2010;122:156-163.
3. Provencher S, Sitbon O, Humbert M, Cabrol S, Jais X, Simonneau G. Long-term outcome
with first-line bosentan therapy in idiopathic pulmonary arterial hypertension. Eur Heart J.
14
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
2006;27:589-595.
4. Sitbon O, Humbert M, Nunes H, Parent F, Garcia G, Herve P, Rainisio M, Simonneau G.
Long-term intravenous epoprostenol infusion in primary pulmonary hypertension: Prognostic
factors and survival. J Am Coll Cardiol. 2002;40:780-788.
5. Miyamoto S, Nagaya N, Satoh T, Kyotani S, Sakamaki F, Fujita M, Nakanishi N, Miyatake K.
Clinical correlates and prognostic significance of six-minute walk test in patients with primary
pulmonary hypertension - comparison with cardiopulmonary exercise testing. Am J Respir Crit
Care Med. 2000;161:487-492.
6. Baker SG, Kramer BS. A perfect correlate does not a surrogate make. BMC Med Res
Methodol. 2003;3:16.
7. Prentice RL. Surrogate endpoints in clinical trials: Definition and operational criteria. Stat
Med. 1989;8:431-440.
Surrogate
8. Ventetuolo CE, Benza RL, Peacock AJ, Zamanian RT, Badesch DB, Kawut SM.
M.. S
Sur
urro
roga
g te
ga
2008;5:617and combined end points in pulmonary arterial hypertension. Proc Am Thorac Soc.
Soc. 20
008
08;5
;5:6
;5
:617
:6
17622.
hypertension:
9. Snow JL,, Kawut SM. Surrogate end points in pu
ppulmonary
lmonary arterial hyp
ypertension: Assessing the
response
2007;28:75-89.
esppon
onsse
se to
to therapy.
therrap
th
apyy.
y. Clin Chest Med. 2007;28:75
75
5-8
- 9.
Macchia
Marchioli
Marfisi
Scarano
Levantesi
G,, Ta
Tavazzi
Tognoni
G.. A me
meta110.
0. M
acchia A,
A M
Mar
arch
chio
ch
oli R
R,, Ma
M
arf
rffissi R,
R, Sca
araano M,
M Lev
evan
ev
ante
t si
te
s G
Tava
vaazzzi L, T
og
gno
noni
ni G
m
eta
analysis
trials
pulmonary
hypertension:
clinical
condition
drugs
an
nallys
y is of tr
tria
ials ooff pu
ulm
monnaryy hy
hype
erteens
ensionn: A cl
lin
nic
ical
al ccon
ondditioon llooking
on
ookking for
for dr
drug
gs an
andd rresearch
eseearrch
methodology.
Heart
me
eth
thod
odol
od
olog
ogy.
og
y. Am
mH
ea
artt JJ.. 2007;153:1037-1047.
20
0077;1
;153
53:1
53
:103
03377-11047
1047
47..
DL,
Brown
AW,
Shorr
AF.
Analyzing
short-term
effect
11. Helman D
L, B
rown
ro
wn A
W, JJackson
acks
ac
k on
ks
o JJL,
L, S
Sho
horr
ho
rrr A
F An
F.
nal
a yz
yzin
ingg th
in
thee sh
shor
ortor
t-te
term
te
rm eeff
ffec
ff
ectt of
ec
o placebo
therapy
hypertension:
Potential
future
her
erap
apyy in ppulmonary
ulmo
ul
mona
nary
ry aarterial
rter
rt
eria
iall hy
hype
pert
rten
ensi
sion
on:: Po
Pote
tent
ntia
iall implications
impl
im
plic
icat
atio
ions
ns for
for the
the design
desi
de
sign
gn ooff fu
futu
ture
re
clinical trials. Chest. 2007;132:764-777.
12. Galie N, Manes A, Negro L, Palazzini M, Bacchi-Reggiani ML, Branzi A. A meta-analysis
of randomized controlled trials in pulmonary arterial hypertension. Eur Heart J. 2009;30:394403.
13. Macchia A, Marchioli R, Tognoni G, Scarano M, Marfisi R, Tavazzi L, Rich S. Systematic
review of trials using vasodilators in pulmonary arterial hypertension: Why a new approach is
needed. Am Heart J. 2010;159:245-257.
14. Johnson KR, Freemantle N, Anthony DM, Lassere MND. Ldl-cholesterol differences
predicted survival benefit in statin trials by the surrogate threshold effect (ste). J Clin Epidemiol.
2009;62:328-336.
15. Buyse M, Molenberghs G. Criteria for the validation of surrogate endpoints in randomized
experiments. Biometrics. 1998;54:1014-1029.
15
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
16. MacKinnon DP, Dwyer JH. Estimating mediated effects in prevention studies. Eval Rev.
1993;17:144-158.
17. Burzykowski T, Buyse M. Surrogate threshold effect: An alternative measure for metaanalytic surrogate endpoint validation. Pharm Stat. 2006;5:173-186.
18. Simonneau G, Barst RJ, Galie N, Naeije R, Rich S, Bourge RC, Keogh A, Oudiz R, Frost A,
Blackburn SD, Crow JW, Rubin LJ. Continuous subcutaneous infusion of treprostinil, a
prostacyclin analogue, in patients with pulmonary arterial hypertension - a double-blind,
randomized, placebo-controlled trial. Am J Respir Crit Care Med. 2002;165:800-804.
19. Galie N, Olschewski H, Oudiz RJ, Torres F, Frost A, Ghofrani HA, Badesch DB, McGoon
MD, McLaughlin VV, Roecker EB, Gerber MJ, Dufton C, Wiens BL, Rubin LJ. Ambrisentan
for the treatment of pulmonary arterial hypertension - results of the ambrisentan in pulmonary
arterial hypertension, randomized, double-blind, placebo-controlled, multicenter, efficacy (aries)
study 1 and 2. Circulation. 2008;117:3010-3019.
Frost
Roux
S,,
20. Rubin LJ, Badesch DB, Barst RJ, Galie N, Black CM, Keogh A, Pulido T, Fros
osst A, R
Rou
ouxx S
arterial
hypertension.
Leconte I, Landzberg M, Simonneau G. Bosentan therapy for pulmonary arteria
al hy
ype
pert
rtten
ensi
sion
si
o .N
on
Engl J Med. 2002;346:896-903.
Olschewski
Simonneau
21. Ol
O
schewski H,, Si
S
monneau G, Galie N, Higenbottam T, Naeije R, Rubin LJ, Nikkho S,
Speich
Spei
Sp
eich
ei
ch R,
R Hoeper
Ho er MM,
M Behr J, Winkler J, Sitbon
on O,
O Popov W, Ghofrani
Gho
h frran
anii HA, Manes A, Kiely
DG,
Ewert
Meyer
A,, Co
Corris
PA,
Delcroix
Gomez-Sanchez
Siedentop
Seeger
DG
G, Ew
E
ertt R, M
eyer
ey
er A
Corr
rris
is P
A, D
Del
elcr
croi
oixx M, Go
Gome
ezz-Sa
Sanc
Sa
n heez M,
M, S
ieede
d nt
ntop
op H
H,, Se
Seeg
eger
eg
e W,
er
W, the
t e
th
Aerosolized
Iloprost
Randomized
Study
iloprost
severe
pulmonary
hypertension.
A
errosolized
ro
Il
loppro
ostt Ran
R
an
ndo
domi
mize
mi
zedd Stud
S
tuddy G. IInhaled
nhaleed ilop
opro
op
rosst
st ffor
or sse
ever
e e pu
ulm
mon
onar
aryy hy
hype
peerttensi
ensi
s on.
Med.
2002;347:322-329.
N En
Engl
g J Med
ed. 20
002;3
347
7:322
22
2-3
329
9.
Frost
EM,
Oudiz
R,, Sh
Shapiro
McLaughlin
Hill
22. Ba
Barst RJ
RJ, Langleben
Lang
La
gle
lebe
b n D,
D F
rost
ro
st A,
A Horn
rn E
M, O
udizz R
Shap
apir
i o S, M
c au
cL
augh
ghli
linn V,
V H
ill N,
Robbins
Zwicke
Duncan
Dixon
RAF,
Frumkin
Sitaxsentan
Tapson VF,, R
obbi
ob
bins
bi
ns IIM,
M Z
M,
wick
wi
ke D, D
Dun
unca
un
cann B, D
ca
ixon
ix
o R
on
AF,, Fr
AF
Frum
u ki
um
k n LR
LR.. Si
S
taaxs
xsen
enta
en
taan therapy
pulmonary
arterial
Respir
forr pu
fo
pulm
lmon
onar
aryy ar
arte
teri
rial
al hhypertension.
yper
yp
erte
tens
nsio
ionn Am J R
espi
es
pirr Crit
Crit Care
Car
aree Med.
Medd 2004;169:441-447.
Me
2004
20
04;1
;169
69:4
:441
41-447
447
23. Barst RJ, Langleben D, Badesch D, Frost A, Lawrence EC, Shapiro S, Naeije R, Galie N.
Treatment of pulmonary arterial hypertension with the selective endothelin-a receptor antagonist
sitaxsentan. J Am Coll Cardiol. 2006;47:2049-2056.
24. Galie N, Ghofrani HA, Torbicki A, Barst RJ, Rubin LJ, Badesch D, Fleming T, Parpia T,
Burgess G, Branzi A, Grimminger F, Kurzyna M, Simonneau G, Sildenafil Use in Pulmonary
Arterial Hypertension Study G. Sildenafil citrate therapy for pulmonary arterial hypertension. N
Engl J Med. 2005;353:2148-2157.
25. Galie N, Brundage BH, Ghofrani HA, Oudiz RJ, Simonneau G, Safdar Z, Shapiro S, White
RJ, Chan M, Beardsworth A, Frumkin L, Barst RJ. Tadalafil therapy for pulmonary arterial
hypertension. Circulation. 2009;119:2894-U2865.
26. Klebanoff MA, Cole SR. Use of multiple imputation in the epidemiologic literature. Am J
Epidemiol. 2008;168:355-357.
16
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
27. SAS version 9.2, SAS Institute Inc., Cary, NC.
28. Freedman LS, Graubard BI, Schatzkin A. Statistical validation of intermediate end-points for
chronic diseases. Stat Med. 1992;11:167-178.
29. Huang J, Huang B. Evaluating the proportion of treatment effect explained by a continuous
surrogate marker in logistic or probit regression models. Stat Biopharm Res. 2010;2:229-238
30. Efron B, Tibshirani RJ. An introduction to the bootstrap. New York: Chapman and Hall;
1993.
31. Jasti S, Dudley WN, Goldwater E. Sas macros for testing statistical mediation in data with
binary mediators or outcomes. Nurs Res. 2008;57:118-122.
32. Gabler NB, French B, Strom BL, Liu Z, Palevsky HI, Taichman DB, Kawut SM, Halpern
SD. Race and sex differences in response to endothelin receptor antagonists for pulmonary
arterial hypertension. Chest. 2012; 141:20-26.
Outcome
33. Kuhn KP, Byrne DW, Arbogast PG, Doyle TP, Loyd JE, Robbins IM. Outco
ome inn 91
epoprostenol.
Respir
consecutive patients with pulmonary arterial hypertension receiving epoprostenol
ol. Am J R
Res
espi
pir
ir
Crit Care Med. 2003;167:580-586.
34.
Lassere
MN.. The
evaluation
34
4. La
Las
sserre MN
sser
M
Th biomarker-surrogacy evalua
uatiion schema: A rreview
ua
evie
ieew of
o the biomarkersurrogate
literature
proposal
criterion-based,
quantitative,
multidimensional
urrrogate li
lite
teera
r tu
ture
re aand
ndd a ppro
r poosa
ro
sall fo
forr a cr
crit
iter
erio
ionn-ba
based,
ba
d,, qqua
uant
ua
n ittat
ativve, m
u tidi
ul
dime
mens
me
n io
ns
iona
nall
levels
schema
status
hhierarchical
hier
i rar
a chical lev
evel
e s off eevidence
viide
denc
ncee sc
nc
sche
hema
he
ma ffor
or eevaluating
vaaluaatinng tthe
hee sst
tattus of bbiomarkers
iom
marke
keerss aass su
ssurrogate
r og
rr
ogat
atee
at
endpoints.
en
ndppoints. St
Stat
a Methods
Methoods Med
Meed Res.
M
Ress. 20
22008;17:303-340.
08;1
; 7:30
303-3440.
30
0.
Holland
six-minute
walk
test:
35. Rasekaba
Rasekkaba
Ra
b T,
T, Lee
Leee AL,
A , Naughton
AL
Naug
Na
ught
hton
o MT,
T, Williams
Wil
Williiam
ams TJ,
TJJ, Ho
Holl
llan
andd AE
AE.. Th
The si
sixx mi
minu
nute
t w
alkk te
test
st: A
cardiopulmonary
Med
2009;39:495-501.
useful metricc fo
forr th
thee ca
card
r io
opu
pulm
mon
o ar
aryy pa
ppatient.
tien
ti
entt.
en
t. In
IIntern
tern
te
rnn M
ed JJ.. 20
2009
0 ;3
09
39:
9:49
49549
5 50
55 1.
1
36. Echt DS, Liebson PR, Mitchell LB, Peters RW, Obias-Manno D, Barker AH, Arensberg D,
Baker A, Friedman L, Greene HL, Huther ML, Richardson DW, and the CAST Investigators.
Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The cardiac
arrhythmia suppression trial. N Engl J Med. 1991;324:781-788.
37. du Bois RM, Weycker D, Albera C, Bradford WZ, Costabel U, Kartashov A, Lancaster L,
Noble PW, Sahn SA, Szwarcberg J, Thomeer M, Valeyre D, King TE, Jr. Six-minute-walk test
in idiopathic pulmonary fibrosis: Test validation and minimal clinically important difference. Am
J Respir Crit Care Med. 2011;183:1231-1237.
38. Redelmeier DA, Bayoumi AM, Goldstein RS, Guyatt GH. Interpreting small differences in
functional status: The six minute walk test in chronic lung disease patients. Am J Respir Crit
Care Med. 1997;155:1278-1282.
39. Hamilton DM, Haennel RG. Validity and reliability of the 6-minute walk test in a cardiac
rehabilitation population. J Cardiopulm Rehabil. 2000;20:156-164.
17
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
40. Fleming TR, DeMets DL. Surrogate end points in clinical trials: Are we being misled? Ann
Intern Med. 1996;125:605-613.
41. Gilbert C, Brown MC, Cappelleri JC, Carlsson M, McKenna SP. Estimating a minimally
important difference in pulmonary arterial hypertension following treatment with sildenafil.
Chest. 2009;135:137-142.
42. Paciocco G, Martinez FJ, Bossone E, Pielsticker E, Gillespie B, Rubenfire M. Oxygen
desaturation on the six-minute walk test and mortality in untreated primary pulmonary
hypertension. Eur Respir J. 2001;17:647-652.
43. Buyse M, Molenberghs G, Burzykowski T, Renard D, Geys H. The validation of surrogate
endpoints in meta-analyses of randomized experiments. Biostatistics. 2000;1:49-67.
44. Halpern SD, Doyle R, Kawut SM. The ethics of randomized clinical trials in pulmonary
arterial hypertension. Proc Am Thorac Soc. 2008;5:631-635.
18
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Table 1. Characteristics of study participants; summaries provided as median (Q1-Q3) unless
otherwise indicated by n (%).
Characteristic
Age, years
Male, n (%)
Race, n (%)
White
Black
Other
Height, cm
Weight, kg
BMI, kg/m2
PAH diagnosis, n (%)
Idiopathic
Connective tissue disease
HIV infection / anorexigen use
Congenital heart disease
NYHA functional classification, n (%)
I/II
III/IV
Baseline hemodynamics
M
eann ri
ea
rright
ghtt at
gh
tri
rial
a ppressure,
al
ressure, mmHg
Mean
atrial
Mea
M
ean pu
ulm
monnar
ary
y arterial pressure, mmHg
Mean
pulmonary
Cardiac ooutput,
utpu
ut
putt, L
pu
/m
min
Cardiac
L/min
Cardiac
index,
L/min/m
C
ardiac ind
dex
x, L
/m
min//m2
Pulmonary
capillary
wedge
mmHg
Pulmonaary
y ca
apillary
yw
ed
dge
ge ppressure,
resssur
re
urre, m
mH
Hg
Pulmonary
resistance,
Wood
Units
Pul
P
ulmo
ul
mona
narry
na
ry vvascular
asccula
cularr re
esi
sist
s an
ncee, W
ood Un
ood
Unit
itss
it
Baseline
Ba
ase
seli
line
in laboratory
lab
laborrat
atory
y values
valluess
va
Hemoglobin,
g/dL
Hemoglo
H
lobi
bin,
n,, g
g/d
/dL
L
Sodium,
mEq/L
Sod
S
odiu
ium,
m, mEq
m
Eq//L
/L
Warfarin use, n (%)
Baseline 6MWD, m
Study, n (%)
ARIES-1
ARIES-2
BREATHE-1
AIR
SUPER
STRIDE-1
STRIDE-2
STRIDE-4
PHIRST
Treprostinil
Active treatment
(n=1563)
50 (38-61)
335 (21)
Placebo
(n=841)
49 (37-60)
192 (23)
1244 (80)
86 (6)
221 (14)
163 (157-169)
69.4 (59.0-82.1)
25.5 (22.5-30.0)
678 (81)
39 (5)
118 (14)
163 (157-170)
70.1 (60.6-83.9)
26.1 (22.9-30.4)
946 (62)
388 (25)
41 (3)
155 (10)
508 (62)
193 (24)
18 (2)
(12)
97 ((12
12))
628 (41)
917 (59)
389
38
9 (4
(47)
7)
432 (53)
8.0 (5.0-12.0)
0))
52.0 (43.0
.0-62
.0
2.0
0)
(43.0-62.0)
4.0 (3
4.0
3.2
.2-5
-5.1
5.1
. )
(3.2-5.1)
22.4
.4
4 (1
((1.9-3.1)
.9--3.1))
(6.0-12.0)
99.0
.0
0 (6.
.0-12.0))
(7.1-16.8)
10.99 ((7
10
7.1--16
16.8
8)
88.0
.0 (5.0-12.0)
54.0 ((45.0-64.5)
45.0-64.5)
3.9
3.
9 (3
(3.2
.2-4
.2
-4.9
.9)
9)
(3.2-4.9)
2.
2.3
.3 ((1.9-3.1)
1.9
9-3
-3..1)
99.0
.00 ((6.0-12.0)
6.0
0-12..0))
111.2
1.2 (7.5
1.2
((7.5-16.0)
7 5-1
-166.0)
0)
14.7 ((13.4-16.0)
14.7
13.4
13
.4-1
-1
16.
6.0)
0))
140
14
40 (138-142)
(138
(1
38-1
-142
42))
42
860 (59)
356 (287-408)
(13.3-16.0)
114.6
14.
4.6
6 (1
(13
3.3
3-16
16.0)
0)
140
14
40 (138-142)
(138
(1
38-1
142
42))
470 (64)
352 (276-410)
134 (9)
127 (8)
145 (9)
101 (6)
204 (13)
118 (8)
123 (8)
64 (4)
314 (20)
233 (15)
67 (8)
65 (8)
69 (8)
101 (12)
65 (8)
60 (7)
62 (7)
34 (4)
81 (10)
237 (28)
BMI, body mass index; HIV, human immunodeficiency virus; NYHA, New York Heart Association ; ARIES,
Ambrisentan in Pulmonary Arterial Hypertension, Randomized, Double-Blind, Placebo-Controlled, Multicenter,
Efficacy Studies; AIR, Aerosolized Iloprost Randomized;BREATHE, Bosentan: Randomized Trial of Endothelin
receptor Antagonist Therapy; STRIDE, Sitaxsentan To Relieve Impaired Exercise; SUPER, Sildenafil Use in
Pulmonary Hypertension; PHIRST, Pulmonary Arterial Hypertension and Response to Tadalafil
19
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Table 2. Characteristics of participating studies and drug/dose combinations
Study
Drug and dose
N
Ambrisentan 5 mg
Ambrisentan 10 mg
Placebo
67
67
67
ARIES-1
ARIES-2
Clinical
events
10
Study Level Statistics
% NYHA
% female % black
III/IV
84
7.3
65
% CTD
31
20
74
0
54
32
9
79
7.1
100
22
41
67
1.5
100
23
7
79
8.1
67
2244
8
77
13.1
13
63
29
2
84
84
6.7
67
6.
39
1155
17
76
2.6
61
30
39
78
9.7
67
24
45
81
5.3
7
19
Ambrisentan 2.5 mg 64
Ambrisentan 5 mg
63
Placebo
65
BREATHE-1
Bosentan 125 mg
Bosentan 250 mg
Placebo
75
70
69
Iloprost
Placebo
101
101
Sitaxsentan 100 mg
Sitaxsentan 300 mg
Placebo
Pla
laace
cebo
b
55
63
60
AIR
STRIDE-1
STRIDE-2
ST
TRI
RID
DE 2
DE-2
Sitaxsentan
Sita
Si
taxs
ta
x en
xs
enta
tan
ta
n 50 mg
mg
Sitaxsentan
Sittax
Si
xsen
enta
tan
n 100
100 mg
mg
Placebo
Pla
acebo
61
662
2
662
2
Sitaxsentan
Sitaxs
Si
xsen
entan
n 50
5 mg
mg
Sitaxsentan
Sita
Si
taxs
xsen
enta
tan
n 10
100
0 mg
g
Placebo
P
lacebo
lace
b
bo
32
32
3
2
334
4
Sildenafil 20 mg
Sildenafil 40 mg
Sildenafil 80 mg
Placebo
68
65
71
65
STRIDE-4
ST
TRI
R DE
DE-4
-4
SUPER
PHIRST
Tadalafil 2.5 mg
Tadalafil 10 mg
Tadalafil 20 mg
Tadalafil 40 mg
Placebo
79
79
81
75
81
Treprostinil
Treprostinil
Placebo
233
237
20
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Table 3. Criteria to establish change in 6MWD as a mediator
Criteria to establish '6MWD as a mediator in the relationship
Results*
between treatment assignment and development of a clinical event
at 12-weeks follow-up
Mean difference: 22.4
Treatment assignment has a significant effect on '6MWD from
(95% CI: 15.9, 28.9)
baseline to 12-weeks follow up
Odds ratio: 0.89 per ten meters
'6MWD has a significant effect on the odds of developing a
(95% CI: 0.87, 0.91)
clinical event
Treatment assignment has a significant effect on the odds of
Odds ratio: 0.43
developing a clinical event at 12-weeks follow-up
(95% CI: 0.31, 0.59)
The effect of treatment assignment on the odds of developing a
Odds ratio: 0.52
clinical event (compare with above) is attenuated with the addition
(95% CI: 0.37, 0.73)
of '6MWD to the model
* All models include adjustment for study and baseline walk; assignment to placebo is the reference for all models
that included treatment.
Table 4. Drug/dose-specific placebo-adjusted results
Study
Drug and dose
ARIES-1
AR
RIE
IES
S-1
S-1
Am
Ambrisentan
5 mg
Ambrisentan
A
Am
bris
br
isen
is
enta
en
tann 100 mg
ta
mg
Ambrisentan
A
Ambr
mbr
bris
iseenta
enta
tann 2.5
2.5 mg
A
Ambrisentan
mbrriseentaan 5 mgg
B
Bosentan
ose
senntaan
an 125
255 m
mg
g
Bosentan
mg
Bose
Bo
seent
ntan
an 250
250
0m
g
Ilop
Il
Iloprost
opro
op
rost
ro
st
Sitaxsentan
mg
S
itax
it
axse
ax
sent
n an
nt
n 1100
0 m
00
g
Sit
Si
Sitaxsentan
t 30
3000 mg
Sitaxsentan 50 mg
Sitaxsentan 100 mg
Sitaxsentan 50 mg
Sitaxsentan 100 mg
Sildenafil 20 mg
Sildenafil 40 mg
Sildenafil 80 mg
Tadalafil 2.5 mg
Tadalafil 10 mg
Tadalafil 20 mg
Tadalafil 40 mg
Treprostinil
ARIES-2
A
RIIES-2
IE
BR
BREATHE-1
REA
ATH
THEE1
AIR
AI
R
STRIDE-1
STRIDE-2
STRIDE-4
SUPER
PHIRST
Difference in '6MWD,
m (95% CI)
OR for clinical
events (95% CI)
Meta regression
weight
24.9 (0.32,
(0.3
(0
.322, 49.4)
41.4
41.4 (15.6,
((155.66, 67.2)
67.2
.2)
2)
37.3
(8.2,
337
7.3 (8
8.2
2, 66.3)
66
6.3
3)
53.6
53..6 (24.4,
(2
24.
4.44, 82.8)
82.
2.8)
8)
33.4
33
4 ((8.6,
8.66,
6, 558.3)
8.33)
8.
3)
46.3
(21.1,
71.6)
46
.3
3 ((21
21.1,
1, 71
1.6
.6)
6)
24
24.5
.5
5 ((-2.4,
-22.4,
4 51
51.3)
.3)
3)
33.3
33
.3
3 ((9.1,
9 1,
9.
1 57.4)
57..4)
224.6
4 6 ((-0.45,
0 45 49
49.7)
7)
-7.1 (-27.6, 13.5)
15.2 (-4.7, 35.1)
-19.1 (-49.9, 11.8)
6.9 (-23.5, 37.5)
39.3 (15.0, 63.6)
45.2 (20.6, 69.8)
42.1 (18.0, 66.3)
-0.3 (-20.7, 20.0)
17.1 (-4.3, 38.5)
24.6 (5.1, 44.1)
18.2 (-2.2, 38.6)
9.9 (-6.7, 26.4)
22.4 (17.4, 27.5)
00.58
. 8 (0
.5
(0.13,
0.1
.13
13, 2.53)
0.38
0.38 ((0.
(0.07,
0.07
0 , 2.
07
2.04
2.04)
04
4)
1.12)
0.35
0.
35 ((0.11,
0 111, 1.
0.
.122)
0.22
0.22 (0
(0.06,
0.0
06, 00.88)
.8
88)
00.58
.58 (0
(0.12
(0.12,
2, 22.80)
.80)
.8
0
0)
00.42
0.
.42
42 ((0.07,
0 07
0.
07,, 22.47)
.47
47))
47
0.47
0.47
47 ((0
(0.23,
0.23
23, 00.96)
23
.96
96))
96
(0.02,
00.20
.220 (0
(0.0
.0
02,
2 11.99)
.99)
.9
9)
00.36
36 ((0.06,
0 06 22.15)
15))
15
0.54 (0.09, 3.20)
0.77 (0.13, 4.72)
0.71 (0, 4.42) *
0.73 (0, 2.07) *
0.36 (0.09, 1.47)
0.25 (0.05, 1.28)
0.59 (0.17, 1.98)
0.49 (0.18, 1.34)
0.30 (0.10, 0.90)
0.59 (0.23, 1.51)
0.27 (0.08, 0.90)
0.52 (0.27, 0.99)
0.44 (0.33, 0.57)
1.8
1.
1.4
.4
22.8
2.
.88
2.1
11.5
.5
11.2
1.
2
77.3
.33
00.7
.7
11.2
2
1.2
1.2
< 0.1
< 0.1
1.9
1.5
2.6
3.8
3.1
4.4
2.7
9.2
Treprostinil
Summary †
CI, confidence interval
Reference group is the placebo group in each study
All analyses are adjusted for baseline walk distance
* Obtained from exact logistic regression
† Obtained from fixed-effects meta-analysis (p-value for heterogeneity = 0.99)
21
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
DOI: 10.1161/CIRCULATIONAHA.112.105890
Figure Legend:
Figure. Results of the meta-regression analysis showing the relationship between changes in
6MWD between baseline and 12-weeks follow-up at the drug/dose level by study on the odds of
a clinical event at 12-weeks. The circles each represent a drug/dose combination, with sizes
proportionate to study weights (detailed in Table 4, and based on inverse variance weighting).
The shaded grey area corresponds to the bounds of the 95% prediction intervals. The threshold
value is indicated on the horizontal axis at 41.8 m.
22
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
Validation of Six-Minute-Walk Distance as a Surrogate Endpoint in Pulmonary Arterial
Hypertension Trials
Nicole B. Gabler, Benjamin French, Brian L. Strom, Harold I. Palevsky, Darren B. Taichman, Steven
M. Kawut and Scott D. Halpern
Circulation. published online June 13, 2012;
Circulation is published by the American Heart Association, 7272 Greenville Avenue, Dallas, TX 75231
Copyright © 2012 American Heart Association, Inc. All rights reserved.
Print ISSN: 0009-7322. Online ISSN: 1524-4539
The online version of this article, along with updated information and services, is located on the
World Wide Web at:
http://circ.ahajournals.org/content/early/2012/06/11/CIRCULATIONAHA.112.105890
Data Supplement (unedited) at:
http://circ.ahajournals.org/content/suppl/2012/06/11/CIRCULATIONAHA.112.105890.DC1.html
http://circ.ahajournals.org/content/suppl/2013/10/02/CIRCULATIONAHA.112.105890.DC2.html
Permissions: Requests for permissions to reproduce figures, tables, or portions of articles originally published in
Circulation can be obtained via RightsLink, a service of the Copyright Clearance Center, not the Editorial Office.
Once the online version of the published article for which permission is being requested is located, click Request
Permissions in the middle column of the Web page under Services. Further information about this process is
available in the Permissions and Rights Question and Answer document.
Reprints: Information about reprints can be found online at:
http://www.lww.com/reprints
Subscriptions: Information about subscribing to Circulation is online at:
http://circ.ahajournals.org//subscriptions/
Downloaded from http://circ.ahajournals.org/ by guest on July 11, 2016
SUPPLEMENTAL MATERIAL:
(1) Supplemental Table 1: Clinical event definitions by study
Study name:
Clinical event definition:
- Death
- Lung or heart transplantation
- Hospitalization for PAH
- Refractory systolic arterial hypotension
AIR
- Worsening right heart failure
- Rapidly progressive cardiogenic, hepatic or renal failure
- Addition of new PAH medication
- A decline in measure of hemodynamic function
ARIES-I
ARIES-II
BREATHE-1
PHIRST
STRIDE-I
STRIDE-II
- Death
- Lung transplantation
- Hospitalization for PAH
- Atrial septostomy
- Addition of other PAH therapeutic agents
- An increase of 1 or more WHO functional class
- Worsening right ventricular failure
- Rapidly progressing cardiogenic, hepatic, or renal failure
- Refractory systolic hypotension
- Death
- Lung transplantation
- Hospitalization for PAH
- Atrial septostomy
- Addition of other PAH therapeutic agents
- An increase of 1 or more WHO functional class
- Worsening right ventricular failure
- Rapidly progressing cardiogenic, hepatic, or renal failure
- Refractory systolic hypotension
- Death
- Lung transplantation
- Hospitalization for worsening PAH
- Atrial septostomy
- Lack of clinical improvement leading to discontinuation
- Need for epoprostenol therapy
- Death
- Lung transplantation
- Atrial septostomy
- Hospitalization due to worsening PAH
- Initiation of new PAH therapy
- Worsening WHO functional class
- Death
- Epoprostenol use
- Atrial septostomy
- Need for lung transplantation
- Death
- Hospitalization for worsening PAH
STRIDE-IV
SUPER
Treprostinil
- Atrial septostomy
- Need for heart/lung or lung transplantation
- Addition of any new type of chronic PAH treatment due to worsening
PAH
- Death
- Hospitalization for worsening PAH
- Need for heart/lung or lung transplantation
- Atrial septostomy
- Addition of any new type of chronic PAH treatment due to worsening
PAH
- Death
- Hospitalization due to worsening PAH
- Lung transplantation
- Addition of additional medication due to worsening PAH
- Death
- Lung transplantation
- Clinical deterioration
(2) Results of sensitivity analysis removing NYHA class IV patients.
Our data included 127 (5%) patients who were NYHA class IV. These patients accounted for 25
(13%) of the clinical events. Removing the NYHA class IV patients does not appreciably
change any of the results (Supplemental Table 1). The proportion of the effect of treatment on
the odds of developing a clinical event at 12 weeks that was explained by ∆6MWD was 20.4%
(95% CI: 9.8% to 30.3%) after removing these patients, rather than 22.1% among the full cohort.
Additionally, we found a threshold effect value of 49.3 m, slightly larger than the threshold
effect of 41.8 m found among the full cohort.
Supplemental Table 2: Criteria to establish ∆6MWD as a mediator, data excludes NYHA class IV
patients
Criteria to establish ∆6MWD as a mediator in the relationship
between treatment assignment and development of a clinical
event at 12-weeks follow-up
Results
Treatment assignment has a significant effect on ∆6MWD
from baseline to 12-weeks follow-up
Mean difference: 22.5
∆6MWD has a significant effect on the odds of developing a
clinical event
Odds ratio: 0.89 per 10 m
Treatment assignment has a significant effect on the odds of
developing a clinical event as 12-weeks follow-up
Odds ratio: 0.39
The effect of treatment assignment on the odds of developing a
clinical event (compare with above) is attenuated with the
addition of ∆6MWD to the model
(95% CI: 15.9, 29.1)
(95% CI: 0.87, 0.91)
(95% CI: 0.28, 0.55)
Odds ratio: 0.48
(95% CI: 0.33, 0.68)
(3) Results of sensitivity analysis removing patients participating in the PHIRST trial.
Removing the PHIRST patients from the mediation analysis did not change the results reported
in the manuscript (Supplemental Table 2). The proportion of the effect of treatment on the odds
of developing a clinical event at 12 weeks that was explained by ∆6MWD was 24.6% (95% CI:
12.1% to 37.1%), compared with 22.1%.
Supplemental Table 3: Criteria to establish ∆6MWD as a mediator, data excludes PHIRST trial
Criteria to establish ∆6MWD as a mediator in the relationship
between treatment assignment and development of a clinical event
at 12-weeks follow-up
Results
Treatment assignment has a significant effect on ∆6MWD from
baseline to 12-weeks follow-up
Mean difference: 23.3
(95% CI: 16.0, 30.7)
∆6MWD has a significant effect on the odds of developing a
clinical event
Odds ratio: 0.88 per 10 m
(95% CI: 0.86, 0.90)
Treatment assignment has a significant effect on the odds of
developing a clinical event at 12-weeks follow-up
Odds ratio: 0.43
(95% CI: 0.31, 0.62)
The effect of treatment assignment on the odds of developing a
clinical event (compare with above) is attenuated with the addition
of ∆6MWD to the model
Odds ratio: 0.53
(95% CI: 0.36, 0.78)
As reported in the manuscript, excluding this study resulted in a smaller threshold value of 25.7
meters.
Artículo original
Validación de la distancia recorrida en 6 minutos
como variable de valoración sustitutiva en los ensayos
realizados en la hipertensión arterial pulmonar
Nicole B. Gabler, PhD, MPH, MHA; Benjamin French, PhD; Brian L. Strom, MD, MPH;
Harold I. Palevsky, MD; Darren B. Taichman, MD, PhD; Steven M. Kawut, MD, MS;
Scott D. Halpern, MD, PhD
Antecedentes—Casi todos los tratamientos existentes para la hipertensión arterial pulmonar han sido aprobados basándose en
el cambio producido en la distancia recorrida en 6 minutos (Δ6MWD) como variable de valoración clínicamente importante, pero no se ha demostrado nunca la validez de esta variable de valoración sustitutiva. El objetivo de este análisis fue
validar la diferencia del Δ6MWD respecto a la probabilidad de aparición de un evento clínico en los ensayos realizados en
la hipertensión arterial pulmonar.
Métodos y resultados—En primer lugar, con objeto de determinar si el Δ6MWD entre la situación basal y el examen realizado al cabo de 12 semanas intervenía en la relación entre la asignación del tratamiento y la aparición de eventos clínicos,
llevamos a cabo un análisis combinado de los datos a nivel de paciente, de 10 ensayos controlados con placebo y aleatorizados presentados anteriormente a la Food and Drug Administration de EEUU (n = 2.404 pacientes). En segundo lugar,
para identificar un efecto umbral en el Δ6MWD que indicara una reducción estadísticamente significativa de los eventos
clínicos, llevamos a cabo una metarregresión en 21 combinaciones de fármacos/niveles de dosis. El Δ6MWD explicó el
22,1% (intervalo de confianza del 95%, 12,1%– 31,1%) del efecto del tratamiento (p < 0,001). El metanálisis mostró una
diferencia media de Δ6MWD de 22,4 m (intervalo de confianza del 95%, 17,4 –27,5 m), favorable al tratamiento activo en
comparación con placebo. El tratamiento activo redujo la probabilidad de un evento clínico (odds ratio de resumen, 0,44;
intervalo de confianza del 95%, 0,33– 0,57). La metarregresión puso de relieve la existencia de un efecto umbral significativo para un valor de 41,8 m.
Conclusiones—Nuestros resultados sugieren que el Δ6MWD no explica una gran parte del efecto del tratamiento, tiene una validez tan solo modesta como variable de valoración sustitutiva de los eventos clínicos, y puede no ser un parámetro de valoración
sustitutivo suficiente. Serán necesarias nuevas investigaciones para determinar si el valor umbral de 41,8 m es válido para los
resultados a largo plazo o si difiere en los distintos ensayos que utilizan el tratamiento de base o carecen por completo de controles con placebo. (Traducido del inglés: Validation of 6-Minute Walk Distance as a Surrogate End Point in Pulmonary
Arterial Hypertension Trials. Circulation. 2012;126:349-356.)
Palabras clave: hypertension, pulmonary ■ meta-analysis ■ statistics ■ trials
L
a hipertensión arterial pulmonar (HAP) es una enfermedad
progresiva que lleva a la insuficiencia cardiaca derecha y
a la muerte1,2. Siete fármacos desarrollados en los últimos 20
años han resultado eficaces para mejorar la distancia recorrida
en 6 minutos (6MWD) en los pacientes con HAP y basándose
en ello, han sido autorizados para su uso en EEUU. Aunque
la 6MWD es considerada por los organismos reguladores una
variable de valoración clínicamente importante de por sí, varios
estudios han indicado que los pacientes que alcanzan una mayor
mejora de la 6MWD (o que llegan a determinados valores absolutos de la 6MWD) presentan mejores resultados clínicos3–5;
sin embargo, estos datos observacionales son insuficientes para
determinar si la 6MWD constituye o no una variable de valoración válida sustitutiva de los eventos clínicos6–9.
Recibido el 9 de diciembre de 2011; aceptado el 16 de mayo de 2012.
Center for Clinical Epidemiology and Biostatistics and Department of Biostatistics and Epidemiology (N.B.G., B.F., B.L.S., S.M.K., S.D.H.); Leonard
Davis Institute of Health Economics (B.F., B.L.S., S.D.H.); Pulmonary, Allergy, and Critical Care Division (H.I.P., D.B.T., S.M.K., S.D.H.); y Pulmonary
Vascular Disease Program of the Penn Cardiovascular Institute (H.I.P., D.B.T., S.M.K., S.D.H.), Perelman School of Medicine, University of Pennsylvania,
Filadelfia, PA.
El suplemento de datos de este artículo, disponible solamente online, puede consultarse en http://circ.ahajournals.org/lookup/suppl/doi:10.1161/
CIRCULATIONAHA.112.105890/-/DC1.
Remitir la correspondencia a Nicole B. Gabler, PhD, Perelman School of Medicine, University of Pennsylvania, 708 Blockley Hall, 423 Guardian Dr,
Philadelphia, PA 19104-6021, EEUU. Correo electrónico [email protected]
© 2012 American Heart Association, Inc.
Puede accederse a la versión original de Circulation en http://circ.ahajournals.org 4
DOI:10.1161/CIRCULATIONAHA.112.105890
Gabler y cols. Validación de la distancia recorrida en 6 minutos 5
Véase la Editorial en la página 1
Véase la Perspectiva Clínica en la página 12
La determinación de la validez de la 6MWD como variable
de valoración sustitutiva en los ensayos realizados en la HAP
es especialmente oportuna teniendo en cuenta los resultados
contradictorios obtenidos en metanálisis recientes10–13. Aunque
algunas de estas contradicciones pueden deberse a un tamaño
muestral o un seguimiento insuficiente o a limitaciones intrínsecas de los metanálisis realizados a nivel de estudios, estas
diferencias sugieren también la posibilidad de que la 6WMD
sea una mala variable sustitutiva indirecta. En el presente estudio, hemos utilizado 2 enfoques complementarios para validar
la 6MWD14–17. En primer lugar, empleamos los datos procedentes de pacientes de todos los ensayos clínicos aleatorizados
de fase 3, existentes, y presentados para la aprobación de fármacos, con objeto de determinar si los cambios de la 6MWD
(Δ6MWD) intervienen en la relación entre la asignación del
tratamiento y los resultados clínicos. En segundo lugar, cuantificamos el grado en el que los efectos del tratamiento sobre el
Δ6MWD predecía los efectos del tratamiento sobre los resultados centrados en el paciente, con el objetivo de determinar
si existe un umbral del Δ6MWD que en caso de ser superado
permita a los investigadores predecir que se producirán unos
resultados clínicos superiores en futuros ensayos.
Métodos
Población en estudio
A través de un contrato de la Food and Drug Administration (FDA)
de EEUU con uno de los autores (S.D.H.), obtuvimos los datos de
los pacientes individuales desidentificados de todos los participantes
en ensayos aleatorizados y controlados con placebo de fase 3 presentados a la FDA hasta 2008 en los que se evaluaron prostanoides,
antagonistas de los receptores de la endotelina o inhibidores de la
fosfodiesterasa. En once ensayos clínicos se examinaron 7 fármacos
(ambrisentán, bosentán, sitaxentán, iloprost, treprostinilo, sildenafilo
y tadalafilo). Excluimos 1 estudio (ensayo BREATHE-2, el Bosentan
Randomized Trial of Endothelin Antagonist Therapy for HAP) por
que incluía tan solo 33 participantes y no era un ensayo de fase 3. Se
ha presentado información adicional de los ensayos en otras publicaciones18–25. Incluimos intencionadamente ensayos de tratamientos
que no fueron aprobados por la FDA (por ejemplo, sitaxentán) a causa
de una toxicidad inaceptable con las dosis efectivas o del uso de dosis que se determinó que no eran efectivas. Tanto en los análisis de
mediador como los de umbral cabría prever un sesgo si incluyéramos
tan solo los tratamientos aprobados por la FDA, y las conclusiones
obtenidas no serían útiles para el diseño de futuros ensayos ni para las
decisiones de las autoridades reguladoras. Todos los ensayos incluidos describían una metodología similar, incluida la evaluación de los
resultados y la obtención de datos en un seguimiento de 12 semanas.
Eventos clínicos
Los eventos clínicos fueron cualquiera de los siguientes antes del final del ensayo: muerte, trasplante de pulmón, septostomía auricular,
hospitalización a causa de agravamiento de la HAP, abandono por
agravamiento de insuficiencia cardiaca derecha o adición de otras
medicaciones para la HAP. No consideramos que un deterioro de la
6MWD constituyera un evento clínico, ya que esta era la variable
de valoración sustitutiva que pretendíamos validar. Se presenta una
información adicional en la Tabla I del Suplemento de Datos Online.
Distancia recorrida en seis minutos
El cambio de la 6MWD se calculó mediante la diferencia en metros
entre la distancia recorrida en la situación basal y la observada a las
12 semanas. La 6MWD basal se registró a las 2 semanas de la asignación aleatoria o dentro de este periodo de tiempo. En todos los análisis, a los pacientes para los que no se dispuso de la 6WMD a las 12
semanas porque habían fallecido durante el ensayo (n = 45, 2%) se les
asignó un valor de 0. Optamos por ese valor para reflejar el hecho de
que las muertes son eventos clínicos de extraordinaria importancia y
para mantener la uniformidad con la medida empleada en la mayoría
de los ensayos incluidos en nuestro análisis. Utilizamos imputaciones
múltiples26 para los valores de los pacientes que sobrevivieron pero
para los que no se dispuso de la 6MWD a las 12 semanas (n = 182,
8%). El modelo de imputación incluía variables asociadas a los eventos clínicos, es decir: 6MWD basal, edad, sexo, peso, raza, altura,
categoría diagnóstica (idiopática, enfermedad del tejido conjuntivo,
infección por VIH/uso de anorexígenos o cardiopatía congénita),
6MWD en el seguimiento a las 4 o 6 semanas, clasificación funcional
de la New York Heart Association (NYHA), uso de warfarina, sodio
basal, gasto cardiaco y presión arterial pulmonar media. Se imputaron cinco conjuntos de datos. Todas las imputaciones se llevaron a
cabo en el programa SAS versión 9.2.
Análisis de mediador
Utilizamos una metodología estándar para determinar si el Δ6MWD
interviene en la relación entre la asignación del tratamiento y la aparición de eventos clínicos en el seguimiento de 12 semanas15,16. Definimos la asignación del tratamiento como tratamiento activo o placebo.
Realizamos un análisis de regresión para evaluar las siguientes 4 hipótesis: (1) La asignación del tratamiento tiene un efecto significativo sobre el Δ6WMD a las 12 semanas respecto al valor basal. (2) El
Δ6MWD tiene un efecto significativo sobre la probabilidad de sufrir
un evento clínico. (3) La asignación del tratamiento tiene un efecto
significativo sobre la probabilidad de sufrir un evento clínico. (4) El
efecto de la asignación del tratamiento sobre la probabilidad de sufrir
un evento clínico se atenúa cuando se añade al modelo el Δ6MWD.
Era necesario rechazar la hipótesis nula en los 4 casos para respaldar
el papel del Δ6MWD como mediador/variable de valoración sustitutiva.
Utilizamos una regresión logística o lineal para los parámetros binarios y continuos, respectivamente. En todos los modelos de regresión
se introdujo un ajuste respecto al estudio con objeto de tener en cuenta
las diferencias existentes a nivel de estudio en la asignación del tratamiento y respecto a la distancia recorrida basal para tener en cuenta
las diferencias existentes a nivel de paciente en el riesgo de eventos
clínicos. No se aplicó ningún otro ajuste, ya que los pacientes fueron
asignados aleatoriamente a los grupos de tratamiento o placebo.
Tras rechazar la hipótesis nula para las 4 hipótesis indicadas,
determinamos la parte de la variabilidad que se explicaba por el
Δ6MWD en la relación entre la asignación del tratamiento y la aparición de un evento clínico27,28. Utilizamos un modelo lineal generalizado con una función de enlace logit (Logit link) para cuantificar la
relación entre la asignación del tratamiento y la log-odds (logit de
la probabilidad de presentar un evento clínico), con un ajuste respecto
al estudio y a la distancia recorrida en la situación basal (modelo “reducido”). A continuación añadimos al modelo el Δ6MWD (modelo
“completo”). El posterior cambio del coeficiente de asignación de
tratamiento entre los modelos reducido y completo indicó la parte
de la variabilidad explicada por el Δ6MWD. Se utilizó un método de
remuestreo bootstrap para establecer un intervalo de confianza (IC)
del cambio porcentual. Se obtuvieron estimaciones del cambio porcentual para cada conjunto de datos de remuestreo, y se utilizó la
desviación estándar de las estimaciones realizadas en 1.000 conjuntos
de datos de remuestreo como error estándar29.
6 Circulation Enero, 2013
Además, utilizamos una prueba de Sobel modificada para determinar si la cantidad de mediación era estadísticamente significativa;
la prueba modificada tenía en cuenta el hecho de que la variable de
valoración sustitutiva (continua) y el resultado clínico (binario) se
expresaban en escalas diferentes16,30. Evaluamos el supuesto de que
no hubiera ninguna modificación del efecto entre el tratamiento y el
mediador30 mediante un ajuste de un modelo de regresión logística
para los eventos clínicos, con un término de interacción entre la asignación del tratamiento y el Δ6MWD.
Análisis de efecto umbral
A continuación realizamos un metanálisis y metarregresión a nivel de
ensayo para determinar la relación del efecto del tratamiento sobre el
mediador (Δ6MWD) con el efecto del tratamiento sobre la probabilidad de sufrir un evento clínico en un seguimiento de 12 semanas. Este
análisis de umbral se llevó a cabo en 4 pasos.
En primer lugar, estimamos los valores de la variable de exposición, el Δ6MWD a nivel de estudio, con un ajuste respecto al placebo,
mediante la realización de regresiones lineales dentro de cada ensayo.
En estas regresiones a nivel de paciente, específicas para cada ensayo, la variable de exposición fue el tratamiento (fármaco y dosis), que
se introdujo en forma de variables indicadoras (con el placebo como
referencia). La variable de resultado fue el Δ6MWD, y nuevamente
se utilizó un ajuste respecto a la 6WMD basal.
En segundo lugar, estimamos los valores del resultado, la logodds a nivel de estudio, con un ajuste para el placebo, de sufrir
un evento clínico entre la situación basal y el seguimiento de 12
semanas, utilizando análisis de regresión logística dentro de cada
ensayo. En estas regresiones a nivel de paciente y específicas para
cada ensayo, el tratamiento (fármaco y dosis, entraron en forma
de variables indicadoras, con el placebo como referencia) fue la
exposición, el evento clínico (sí o no) fue el resultado, y se introdujo un ajuste respecto a la 6MWD basal. Se utilizó una regresión
logística exacta cuando el número de eventos clínicos de un estudio era bajo.
En tercer lugar, utilizamos las 21 combinaciones de fármaco/
dosis en comparación con placebo de todos los ensayos en una metarregresión de efectos fijos que relacionaba la diferencia estimada
de Δ6MWD con el valor estimado de log odds ratio (OR) para los
eventos clínicos. Se utilizó el cuadrado del inverso del error estándar
como factor de ponderación para tener en cuenta la incertidumbre en
la estimación del log OR. Determinamos el efecto umbral mediante
el cálculo de las franjas de predicción del 95% alrededor de la línea
de metarregresión. El umbral se calculó determinando el valor de la
diferencia de Δ6MWD en el lugar en el que la franja de predicción
superior cortaba el valor nulo de 1,0 para la probabilidad relativa de
un evento clínico. Las franjas de predicción cuantifican la incertidumbre existente en la predicción de la diferencia de agravamiento
clínico en un solo ensayo dada una diferencia definida del Δ6MWD.
La linealidad del modelo de regresión final se evaluó con un método
de diagnóstico de regresión estándar.
Por último, intentamos determinar si las características de los pacientes a nivel de estudio introducían una confusión en la asociación
entre el Δ6MWD y las probabilidades relativas de eventos clínicos.
Los posibles factores de confusión se decidieron a priori en función
de las diferencias conocidas de la respuesta al tratamiento según la
raza y el sexo31 y según el diagnóstico y la clasificación funcional
de la NYHA32. En consecuencia, las covariables de nuestro modelo de
regresión fueron las siguientes: raza (porcentaje de raza negra), sexo
(porcentaje de mujeres), categoría diagnóstica de la HAP (porcentaje
de casos asociados al tejido conjuntivo) y clasificación funcional de
la NYHA (porcentaje de clase III o IV). Si un posible factor de confusión modificaba el coeficiente de la variable de tratamiento en ≥ 10%,
se mantenía en el modelo final.
Tabla 1. Características de los participantes en el estudio
Característica
Tratamiento activo
(n 1.563)
Edad, años
50 (38 – 61)
Varones, n (%)
335 (21)
Raza, n (%)
Blancos
1.244 (80)
Negros
86 (6)
Otros
221 (14)
Altura, cm
163 (157–169)
Peso, kg
69,4 (59,0–82,1)
IMC, kg/m2
25,5 (22,5–30,0)
Diagnóstico de HAP, n (%)
Idiopática
946 (62)
Enfermedad del tejido conjuntivo
388 (25)
Infección por VIH/uso de anorexígenos 41 (3)
Cardiopatía congénita
155 (10)
Clasificación funcional de la NYHA, n (%)
I/II
628 (41)
III/IV
917 (59)
Hemodinámica basal
Presión auricular derecha
8,0 (5,0–12,0)
media, mmHg
Placebo
(n 841)
49 (37– 60)
192 (23)
678 (81)
39 (5)
118 (14)
163 (157–170)
70,1 (60,6–83,9)
26,1 (22,9–30,4)
508 (62)
193 (24)
18 (2)
97 (12)
389 (47)
432 (53)
8,0 (5,0–12,0)
Presión arterial pulmonar
media, mmHg
52,0 (43,0–62,0)
54,0 (45,0–64,5)
Gasto cardiaco, L/min
Índice cardiaco, L/min/m2
4,0 (3,2–5,1)
3,9 (3,2–4,9)
2,4 (1,9–3,1)
9,0 (6,0–12,0)
2,3 (1,9–3,1)
9,0 (6,0–12,0)
10,9 (7,1–16,8)
11,2 (7,5–16,0)
14,7 (13,4–16,0)
140 (138–142)
860 (59)
356 (287–408)
14,6 (13,3–16,0)
140 (138–142)
470 (64)
352 (276–410)
134 (9)
127 (8)
145 (9)
101 (6)
204 (13)
118 (8)
123 (8)
64 (4)
314 (20)
233 (15)
67 (8)
65 (8)
69 (8)
101 (12)
65 (8)
60 (7)
62 (7)
34 (4)
81 (10)
237 (28)
Presión capilar pulmonar
enclavada, mmHg
Resistencia vascular pulmonar,
unidades Wood
Valores analíticos basales
Hemoglobina, g/dL
Sodio, mEq/L
Uso de warfarina, n (%)
6MWD basal, m
Estudio, n (%)
ARIES-1
ARIES-2
BREATHE-1
AIR
SUPER
STRIDE-1
STRIDE-2
STRIDE-4
PHIRST
Treprostinilo
IMC indica índice de masa corporal; HAP, hipertensión arterial pulmonar; VIH, virus de la inmunodeficiencia humana; NYHA, New York Heart Association; 6MWD,
distancia recorrida en 6 minutos; ARIES, Ambrisentan in Pulmonary Arterial Hypertension, Randomized, Double-Blind, Placebo-Controlled, Multicenter, Efficacy
Studies; AIR, Aerosolized Iloprost Randomized; BREATHE, Bosentan: Randomized
Trial of Endothelin receptor Antagonist Therapy; STRIDE, Sitaxsentan To Relieve
Impaired Exercise; SUPER, Sildenafil Use in Pulmonary Hypertension; y PHIRST,
Pulmonary Arterial Hypertension and Response to Tadalafil.
Los resúmenes estadísticos se presentan en forma de mediana (cuartil 1-cuartil 3)
a menos que se indique lo contrario con n (%).
Gabler y cols. Validación de la distancia recorrida en 6 minutos 7
Tabla 2. Características de los estudios y las combinaciones de fármacos
Estadísticas a nivel
de estudio
Estudio y fármaco/dosis
n
ARIES-1
Ambrisentán 5 mg
67
Ambrisentán 10 mg
67
Placebo
67
ARIES-2
Ambrisentán 2,5 mg
64
Ambrisentán 5 mg
63
Placebo
65
BREATHE-1
Bosentán 125 mg
75
Bosentán 250 mg
70
Placebo
69
AIR
Iloprost
101
Placebo
101
STRIDE-1
Sitaxentán 100 mg
55
Sitaxentán 300 mg
63
Placebo
60
STRIDE-2
Sitaxentán 50 mg
61
Sitaxentán 100 mg
62
Placebo
62
STRIDE-4
Sitaxentán 50 mg
32
Sitaxentán 100 mg
32
Placebo
34
SUPER
Sildenafilo 20 mg
68
Sildenafilo 40 mg
65
Sildenafilo 80 mg
71
Placebo
65
PHIRST
Tadalafilo 2,5 mg
79
Tadalafilo 10 mg
79
Tadalafilo 20 mg
81
Tadalafilo 40 mg
75
Placebo
81
Treprostinilo
Treprostinilo
233
Placebo
237
Eventos clínicos, n
% Mujeres
% Negros
% NYHA III/IV
% ETC
10
84
7,3
65
31
20
74
0
54
32
9
79
7,1
100
22
41
67
1,5
100
23
7
79
8,1
67
24
8
77
13,1
63
29
2
84
6,7
39
15
17
76
2,6
61
30
39
78
9,7
67
24
45
81
5,3
7
19
NYHA indica New York Heart Association ETC, enfermedad del tejido conjuntivo; ARIES, Ambrisentan in Pulmonary
Arterial Hypertension, Randomized, Double-Blind, Placebo-Controlled, Multicenter, Efficacy Studies; BREATHE, Bosentan: Randomized Trial of Endothelin receptor Antagonist Therapy; AIR, Aerosolized Iloprost Randomized; STRIDE, Sitaxsentan To Relieve Impaired Exercise; SUPER, Sildenafil Use in Pulmonary Hypertension; y PHIRST, Pulmonary Arterial
Hypertension and Response to Tadalafil.
Llevamos a cabo 2 análisis secundarios. En primer lugar, excluimos el estudio PHIRST (Pulmonary Arterial Hypertension and Response to Tadalafil), en el que se permitió que los pacientes utilizaran
un tratamiento de base con otros fármacos específicos para la HAP
aprobados. En segundo lugar, excluimos a los pacientes que estaban
en la clase IV de la NYHA en el momento de la aleatorización, ya
que es improbable que estos pacientes sean incluidos en futuros ensayos clínicos. Todas las regresiones y metarregresiones se realizaron
8 Circulation Enero, 2013
Tabla 3. Criterios para establecer que el cambio de la 6MWD interviene en la relación entre la asignación del tratamiento y la aparición de
un evento clínico en un seguimiento de 12 semanas
Criterios
Resultados*
La asignación del tratamiento tiene un efecto significativo en el Δ6MWD respecto al valor basal
a las 12 semanas de seguimiento
El Δ6MWD tiene un efecto significativo en la probabilidad de presentar un evento clínico
Diferencia media, 22,4 (IC del 95%, 15,9 –28,9)
La asignación del tratamiento tiene un efecto significativo sobre la probabilidad de presentar un
evento clínico a las 12 semanas de seguimiento
El efecto de la asignación del tratamiento sobre la probabilidad de presentar un evento clínico
(en comparación con lo indicado antes) es atenuado con la adición del Δ6MWD al modelo
OR, 0,43 (IC del 95% 0,31-0,59)
OR, 0,89 por 10 m (IC del 95%, 0,87–0,91)
OR, 0,52 (IC del 95% 0,37-0,73)
6MWD indica distancia recorrida en 6 minutos; IC, intervalo de confianza; y OR, odds ratio.
*Todos los modelos incluyen un ajuste respecto al estudio y a la distancia recorrida en la situación basal; la asignación al grupo placebo constituye el grupo de referencia para todos los modelos que incluían el tratamiento.
con el programa R versión 2.13 (R Development Core Team, Viena,
Austria).
El comité ético de la University of Pennsylvania determinó que
este estudio estaba eximido de la exigencia de autorización (aprobación número 814001). Todos los coautores tuvieron acceso a los
datos del estudio, asumen la responsabilidad del análisis, y tuvieron
autoridad en la elaboración del manuscrito y la decisión de presentarlo para publicación.
Resultados
Los 10 ensayos incluían un total de 2.404 pacientes; a 1.563
(65%) se les asignó el tratamiento activo. La mediana de edad
de los participantes era de 50 años (rango, 10–90 años), un
22% eran varones, y un 5% eran de raza negra (Tabla 1). En
581 pacientes (24%) el diagnóstico era de HAP causada por
una enfermedad del tejido conjuntivo, y 1.349 (56%) fueron
clasificados en clase III o IV de la NYHA. Fallecieron 45 pacientes (2%) entre la situación basal y el seguimiento realizado a las 12 semanas. Otros 153 pacientes (6%) presentaron
otros eventos clínicos; en 83 de ellos no se dispuso de datos de
distancia recorrida a las 12 semanas. La media de la distancia
recorrida en la situación basal fue de 341 m (DE, 85,7 m).
Los valores demográficos, antropométricos, analíticos y hemodinámicos fueron similares en los distintos grupos definidos según la asignación del tratamiento.
Las características de los 10 ensayos se indican en la Tabla 2. Los porcentajes a nivel de estudio de mujeres y de pacientes con diagnóstico de HAP relacionada con enfermedad del tejido conjuntivo fueron uniformes en los diversos estudios. Los
porcentajes de clase III/IV de la NYHA y de pacientes de raza
negra mostraron una mayor variación en los diversos estudios.
¿Interviene la 6MWD en la relación entre la asignación del tratamiento y los eventos clínicos?
Los 4 criterios necesarios para establecer que el Δ6MWD es
un mediador en la relación entre la asignación del tratamiento
y la aparición de un evento clínico se indican en la Tabla 3.
Para cada uno de ellos, observamos un resultado estadísticamente significativo en el sentido requerido. En primer lugar
la asignación al tratamiento activo en comparación con la
asignación a placebo dio lugar a diferencias mayores en el
Δ6MWD (diferencia media del Δ6MWD, 22,4 m; IC del 95%,
15,9–28,9 m). En segundo lugar, las diferencias mayores del
Δ6MWD reducían significativamente las probabilidades de
eventos clínicos en el seguimiento realizado a las 12 semanas
(OR para un aumento de 10 m en el Δ6MWD, 0,89; IC del
95%, 0,87–0,91). En tercer lugar, la asignación al tratamiento
activo en comparación con la asignación a placebo redujo significativamente la probabilidad relativa de eventos clínicos a
las 12 semanas (OR, 0,43; IC del 95%, 0,31–0,59). Por último,
el efecto de la asignación del tratamiento sobre la aparición de
un evento clínico se atenuaba con la adición del Δ6MWD al
modelo (OR, 0,52; IC del 95%, 0,37–0,73). La parte del efecto
del tratamiento sobre las probabilidades de sufrir un evento
clínico a las 12 semanas que se explicaba por el Δ6MWD fue
del 22,1% (IC del 95%, 12,1–31,1%). Además, la prueba de
Sobel modificada confirmó la significación estadística de la
mediación (Z = 4,77, p < 0,001). No hubo interacciones significativas entre el tratamiento y el Δ6MWD (estimación [IC del
95%], 0,002 [-0,002 a 0,006], p = 0,25).
¿Existe un efecto umbral para el Δ6MWD?
En comparación con placebo, casi todas las combinaciones de
fármaco/dosis produjeron un valor superior del Δ6MWD en el
seguimiento realizado a las 12 semanas (Tabla 4). El resumen
de los resultados indica una diferencia media del Δ6MWD de
22,4 m (IC del 95%, 17,4 –27,5 m) con la asignación al tratamiento activo en comparación con placebo. El efecto sobre
la reducción de los eventos clínicos fue uniforme con las diversas combinaciones de fármaco/dosis. En comparación con
placebo, las 21 combinaciones de fármaco/dosis redujeron las
probabilidades de aparición de un evento clínico en el seguimiento de 12 semanas (OR de resumen, 0,44; IC del 95%,
0,33–0,57).
En la Figura se muestran los resultados de nuestra metarregresión y análisis de umbral. El intervalo superior de la predicción cortaba el valor nulo para la probabilidad relativa de
un evento clínico con una diferencia de Δ6MWD de 41,8 m.
Este valor indica la diferencia mínima del Δ6MWD que corresponde a una reducción estadísticamente significativa de
los eventos clínicos. Los modelos que incluían los factores
de raza, sexo, categoría diagnóstica y clase funcional de la
NYHA no mostraron indicio alguno de un efecto de confusión
y estas variables no se incluyeron en el modelo de metarregresión final.
En un análisis de sensibilidad, excluimos las 4 combinaciones de fármaco/dosis del estudio PHIRST, ya que este estudio
fue el único en el que se permitió el uso de un tratamiento de
base concomitante. La exclusión de este estudio hizo que el
Gabler y cols. Validación de la distancia recorrida en 6 minutos 9
Tabla 4. Resultados específicos para fármaco/dosis ajustados según el efecto placebo
Estudio y fármaco/dosis
Diferencia de Δ6MWD,
m (IC del 95%)
OR para los eventos
clínicos (IC del 95%)
Ponderación en
la metarregresión
ARIES-1
Ambrisentán 5 mg
24,9 (0,32–49,4)
0,58 (0,13–2,53)
1,8
Ambrisentán 10 mg
41,4 (15,6–67,2)
0,38 (0,07–2,04)
1,4
Ambrisentán 2,5 mg
37,3 (8,2–66,3)
0,35 (0,11–1,12)
2,8
Ambrisentán 5 mg
53,6 (24,4–82,8)
0,22 (0,06–0,88)
2,1
Bosentán 125 mg
33,4 (8,6–58,3)
0,58 (0,12–2,80)
1,5
Bosentán 250 mg
46,3 (21,1–71,6)
0,42 (0,07–2,47)
1,2
24,5 ( 2,4–51,3)
0,47 (0,23–0,96)
7,3
Sitaxentán 100 mg
33,3 (9,1–57,4)
0,20 (0,02–1,99)
0,7
Sitaxentán 300 mg
24,6 ( 0,45–49,7)
0,36 (0,06–2,15)
1,2
7,1 ( 27,6–13,5)
0,54 (0,09–3,20)
1,2
0,77 (0,13–4,72)
1,2
ARIES-2
BREATHE-1
AIR
Iloprost
STRIDE-1
STRIDE-2
Sitaxentán 50 mg
Sitaxentán 100 mg
15,2 ( 4,7–35,1)
STRIDE-4
Sitaxentán 50 mg
19,1 ( 49,9–11,8)
0,71 (0–4,42)*
0,1
Sitaxentán 100 mg
6,9 ( 23,5–37,5)
0,73 (0–2,07)*
0,1
SUPER
Sildenafilo 20 mg
39,3 (15,0–63,6)
0,36 (0,09–1,47)
1,9
Sildenafilo 40 mg
45,2 (20,6–69,8)
0,25 (0,05–1,28)
1,5
Sildenafilo 80 mg
42,1 (18,0–66,3)
0,59 (0,17–1,98)
2,6
PHIRST
Tadalafilo 2,5 mg
0,49 (0,18–1,34)
3,8
Tadalafilo 10 mg
17,1 ( 4,3–38,5)
0,3 ( 20,7–20,0)
0,30 (0,10–0,90)
3,1
Tadalafilo 20 mg
24,6 (5,1–44,1)
0,59 (0,23–1,51)
4,4
Tadalafilo 40 mg
18,2 ( 2,2–38,6)
0,27 (0,08–0,90)
2,7
9,9 ( 6,7–26,4)
0,52 (0,27–0,99)
9,2
Treprostinilo
Treprostinilo
Resumen†
22,4 (17,4–27,5)
0,44 (0,33–0,57)
6MWD indica distancia recorrida en 6 minutos; IC, intervalo de confianza; OR, odds ratio; ARIES, Ambrisentan in Pulmonary Arterial Hypertension, Randomized, Double-Blind, Placebo-Controlled, Multicenter, Efficacy Studies; BREATHE,
Bosentan: Randomized Trial of Endothelin receptor Antagonist Therapy; AIR, Aerosolized Iloprost Randomized; STRIDE,
Sitaxsentan To Relieve Impaired Exercise; SUPER, Sildenafil Use in Pulmonary Hypertension; y PHIRST, Pulmonary Arterial Hypertension and Response to Tadalafil.
El grupo de referencia es el grupo placebo en cada estudio. Todos los análisis incluyen un ajuste respecto a la distancia recorrida en la situación basal.
*Obtenido mediante regresión logística exacta.
†Obtenido mediante metanálisis de efectos fijos (p para la heterogeneidad = 0,99).
valor umbral fuera más bajo, de 25,7 m, para la diferencia
del Δ6MWD. En otro análisis adicional, la exclusión de los
pacientes que estaban en la clase IV de la NYHA (n = 127)
no modificó los resultados de manera apreciable. Se presenta
una información adicional al respecto en el Suplemento de
Datos Online.
Discusión
Este estudio presenta el primer examen riguroso de la validez
del Δ6WMD a las 12 semanas respecto al valor basal como
variable de valoración sustitutiva en los ensayos terapéuticos
de la HAP. El Δ6MWD cumplió todos los criterios de mediador de la relación entre el tratamiento y la aparición de un
evento clínico en el seguimiento de 12 semanas; sin embargo,
la parte de esta relación explicada por la 6MWD era modesta,
de un 22%, lo cual sugiere que la 6MWD puede no ser una
variable sustitutiva suficiente. Se identificó también un efecto
umbral de 41,8 m, lo cual significa que si un fármaco mejora
la 6MWD a lo largo de 12 semanas en 41,8 m más de lo que
lo hace el placebo, los investigadores podrían predecir, con un
nivel de confianza del 95%, que el fármaco reduciría la tasa de
eventos clínicos a lo largo de 12 semanas.
10 Circulation Enero, 2013
Figura. Resultados del análisis de metarregresión que muestra la
relación entre los cambios de la distancia recorrida en 6 minutos
(6MWD) a las 12 semanas de seguimiento respecto a la situación
basal a nivel de fármaco/dosis según el estudio con la probabilidad
de un evento clínico a las 12 semanas. Cada círculo corresponde
a una combinación de fármaco/dosis, y los tamaños son proporcionales a la ponderación del estudio (tal como se detalla en la
Tabla 4 y en función de una ponderación inversa de la varianza).
El área gris sombreada corresponde a los límites de los intervalos de
predicción del 95%. El valor umbral se indica en el eje horizontal
en 41,8 m.
Observamos que tan solo 4 de las 21 combinaciones de
fármaco-dosis producían efectos sobre el Δ6MWD que pudiera afirmarse, con un grado de certeza convencional, que
se asociaban a una mejoría clínica (Figura). Si se utiliza el
valor de umbral inferior de 25,7 m, 5 de las 17 combinaciones de fármaco-dosis restantes producirían efectos estadísticamente significativos sobre los resultados clínicos en ausencia de un tratamiento de base. De estas 9 combinaciones
de fármaco-dosis que cumplían el criterio del valor umbral
inferior, 1 correspondía a un fármaco que no ha sido autorizado por la FDA (sitaxentán) y 2 a dosis que no se incluyen
en el prospecto de la FDA (sildenafilo 40 mg 3 veces al día
y sildenafilo 80 mg 3 veces al día). Tres fármacos (iloprost,
tadalafilo y treprostinilo) no cumplían ninguno de los dos
criterios de valor umbral.
Es esencial explorar la validez de las variables de valoración sustitutivas, ya que las que son válidas proporcionan
un mecanismo eficiente para la realización de los estudios
de nuevas intervenciones en las fases iniciales. Concretamente, los ensayos que utilizan variables de valoración
sustitutivas validadas pueden llevarse a cabo con mayor rapidez, con tamaños muestrales menores, con menos riesgos
para los participantes y con un menor coste de investigación, en comparación con los ensayos que utilizan las variables de valoración clínicas reales33,34. Sin embargo, estas
ventajas solamente se dan de forma clara si las variables de
valoración sustitutivas han sido validadas; en ausencia
de validación, existe un considerable riesgo, tal como
hizo famoso el Cardiac Arrhythmia Suppression Trial
(CAST)35, de que se llegue erróneamente a una conclusión
de efectividad de una nueva intervención.
Estos datos añaden también nueva información a la cada
vez más amplia literatura existente sobre el uso de la 6MWD
como variable de valoración en otros contextos. Con el empleo de diferentes métodos, se ha evaluado la 6MWD en la
fibrosis pulmonar idiopática36, la enfermedad pulmonar obstructiva crónica37 y la rehabilitación cardiaca38. En el presente estudio, observamos que la parte del efecto de tratamiento
en la prevención de los eventos clínicos que se explicaba
por el cambio de la 6MWD era de un 22,1%, lo cual está por
debajo del umbral del 50% a 75% descrito para una variable sustitutiva válida por Freedman y cols.27 aunque algunos
autores consideran que este criterio es demasiado estricto15.
Parece claro que los tratamientos de la HAP ejercen unos
efectos sobre el resultado no medidos que no son explicados
plenamente por el cambio de la 6MWD39. Así pues, la observación de una mediación real aunque modesta por parte
de la 6MWD sugiere que puede no ser suficiente utilizarla
sola. La incorporación en una medida sustitutiva combinada,
junto con evaluaciones hemodinámicas o de otro tipo podría
mejorar su rendimiento y justificar la realización de nuevos
estudios.
El valor umbral de 41,8 m que identificamos para la diferencia del Δ6MWD puede tenerse en cuenta para un uso
como nivel de mejora del Δ6MWD que es necesario para poder concluir de manera fiable que la intervención aportará un
beneficio clínico en futuros ensayos. Con el empleo de diferentes métodos y pacientes de un único estudio (el estudio
SUPER [Sildenafil Use in Pulmonary Arterial Hypertension),
Gilbert y cols.40 estimaron una diferencia mínima clínicamente importante de 41 m, que estaba correlacionada con la mejoría descrita por el paciente. De igual modo, en pacientes con
HAP no tratados, Paciocco y cols.41 observaron que cada 50
m de aumento en la distancia recorrida se asociaban a una
reducción de la mortalidad del 18%. La coincidencia de los
resultados en los diversos estudios realizados con el empleo
de métodos diferentes respalda la solidez de este resultado.
Sin embargo, el Δ6MWD continúa siendo una variable de
valoración sustitutiva insuficiente, dado el grado modesto
de mediación en el efecto del tratamiento.
La fiabilidad de los resultados del presente estudio deriva
del gran tamaño muestral utilizado y del hecho de que los
efectos del tratamiento sobre los cambios de la 6MWD y sobre los eventos clínicos fueron uniformes con todas las dosis
de medicación42. No obstante, el presente estudio tiene ciertas limitaciones. En primer lugar, como ocurre en cualquier
metanálisis, los resultados están sujetos a posibles errores
en la realización, entrada de datos o análisis de los datos
principales. En segundo lugar, estos ensayos principales incluyeron principalmente a mujeres y a individuos blancos, y
utilizaron unos periodos de seguimiento relativamente breves. No pudimos evaluar los resultados clínicos posteriores a
las 12 semanas, y nuestros resultados no deben generalizarse
a un periodo superior a este. Sin embargo, las características
demográficas representadas concuerdan con la epidemiología más amplia de la HAP, y todos los ensayos incluidos
tenían unas características similares en cuanto a seguimiento, definiciones de los eventos clínicos y evaluación de los
resultados, lo cual hace que sean apropiados para un planteamiento metanalítico.
Todos los ensayos que hemos examinado utilizaron un
diseño controlado con placebo, lo cual constituye un punto
Gabler y cols. Validación de la distancia recorrida en 6 minutos 11
fuerte adicional; sin embargo, 1 estudio permitió el uso de
un tratamiento de base concomitante. La exclusión del ensayo
PHIRST redujo nuestro valor umbral, lo cual sugiere que en
futuros ensayos en los que se empleen tratamientos de base
puede ser preciso utilizar valores umbrales superiores a los indicados aquí. En otras palabras, en presencia de un tratamiento efectivo para la HAP, un ensayo controlado y aleatorizado
de un nuevo tratamiento puede requerir la obtención de mayores diferencias del Δ6MWD para indicar de manera fiable
que los resultados corresponden a diferencias en la evolución
clínica. No pudimos explorar con mayor profundidad el papel
del tratamiento de base debido al pequeño tamaño muestral.
Así pues, serán necesarias nuevas investigaciones teniendo
en cuenta las cuestiones éticas que se plantean en relación
con la futura realización de ensayos controlados con placebo
en la HAP43.
Por último, utilizamos técnicas estadísticas para poder
abordar mejor una cuestión clínica. Aunque nuestra estimación del umbral proporciona una idea clara del grado
de Δ6MWD que sería necesario para indicar que los efectos beneficiosos de un tratamiento serán superiores a cero,
la inferencia de una diferencia “clínicamente importante”
en los resultados podría justificar el empleo de un umbral
diferente. Los pacientes individuales pueden mostrar una
mejoría clínica sin alcanzar un determinado valor umbral
del Δ6MWD, y hay pacientes que mejoran su 6MWD sin
presentar necesariamente una mejoría clínica. Sin embargo, los valores umbral a nivel de población que hemos
establecido serán útiles para el diseño de futuros ensayos
clínicos.
En conclusión, hemos utilizado 2 enfoques complementarios para examinar la validez del Δ6MWD como
variable de valoración sustitutiva en ensayos clínicos de
tratamientos para la HAP. Pudimos identificar un efecto
umbral significativo del Δ6MWD que puede usarse como
guía para futuros ensayos controlados y aleatorizados, y
observamos que el Δ6MWD es un mediador en la relación
entre el tratamiento y los resultados clínicos. Sin embargo, dado que el Δ6MWD no explica una gran parte de este
efecto del tratamiento, puede no ser suficiente para poder
usarlo como variable de valoración sustitutiva por sí sola.
Serán necesarios nuevos estudios para identificar variables
de valoración sustitutivas combinadas que puedan tener
unas características mejores y para determinar si este valor
umbral que identificamos es aplicable a los ensayos que
utilizan un tratamiento de base o que no emplean ningún
control de placebo.
Agradecimientos
Agradecemos a Maximilian Herlim y a Ziyue Liu, PhD, su inestimable ayuda en la preparación de los datos para el análisis y a los Drs.
Norman Stockbridge y Salma Lemtouni de la FDA que nos proporcionaran los datos para la realización de este estudio.
Fuentes de financiación
Este trabajo fue financiado por una subvención de la American Thoracic Society/Pfizer para investigación en hipertensión pulmonar (Dr.
Halpern). El Dr. Kawut recibió la subvención K24 HL103844. Ni
la FDA ni las fuentes de financiación intervinieron en modo alguno
en el diseño de este estudio ni en la decisión de presentarlo para pu-
blicación. La FDA revisó el estudio antes de la presentación, según
la condición establecida en el contrato original, pero no solicitó la
introducción de cambio alguno en nuestro texto.
Declaraciones de intereses
El Dr. Gabler ha participado en proyectos no relacionados financiados por Pfizer, Inc. El Dr. Strom ha sido consultor de Abbott, Amgen, Astra Zeneca, BMS, Boehringer Ingelheim, GlaxoSmithKline,
Novartis, NPS Pharma, Nuvo Research, Orexigen, Pfizer, Teva y
Vivus, y ha recibido financiación para investigación de AstraZeneca, BMS, Pfizer, Shire y Takeda. Ha recibido pagos por la contribución al programa de formación en farmacoepidemiología de
Penn, por parte de Abbott, Amgen, Hoffman LaRoche, Novartis,
Pfizer, Sanofi Pasteur y Wyeth. El Dr. Palevsky ha recibido pagos
por consultoría, por pertenencia a consejos asesores, por conferencias y/o financiación para investigación de Actelion, Bayer, GeNO,
Gilead, GlaxoSmithKline, Pfizer, United Therapeutics y Lung Rx.
Estas labores no han influido en modo alguno en este análisis de los
resultados de estudios publicados con anterioridad. El Dr. Kawut
ha recibido pagos por consultoría, pertenencia a consejos asesores
y conferencias, subvenciones de formación no condicionadas y/o
financiación para investigación de Pfizer, Actelion, Bayer, Ikaria,
Novartis, Merck, Gilead, United Therapeutics y Lung Rx. El Dr.
Taichman ha recibido financiación para investigación del centro por
parte de Actelion. Los demás autores no declaran ningún conflicto
de intereses.
Bibliografía
1. Taichman DB, Mandel J. Epidemiology of pulmonary arterial hypertension. Clin Chest Med. 2007;28:1–22.
2. Humbert M, Sitbon O, Chaouat A, Bertocchi M, Habib G, Gressin V, Yaici
A, Weitzenblum E, Cordier JF, Chabot F, Dromer C, Pison C, ReynaudGaubert M, Haloun A, Laurent M, Hachulla E, Cottin V, Degano B, Jais X,
Montani D, Souza R, Simonneau G. Survival in patients with idiopathic,
familial, and anorexigen-associated pulmonary arterial hypertension in the
modern management era. Circulation. 2010;122:156 –163.
3. Provencher S, Sitbon O, Humbert M, Cabrol S, Jais X, Simonneau G.
Long-term outcome with first-line bosentan therapy in idiopathic pulmonary arterial hypertension. Eur Heart J. 2006;27:589 –595.
4. Sitbon O, Humbert M, Nunes H, Parent F, Garcia G, Herve P, Rainisio M,
Simonneau G. Long-term intravenous epoprostenol infusion in primary
pulmonary hypertension: prognostic factors and survival. J Am Coll
Cardiol. 2002;40:780 –788.
5. Miyamoto S, Nagaya N, Satoh T, Kyotani S, Sakamaki F, Fujita M,
Nakanishi N, Miyatake K. Clinical correlates and prognostic significance
of six-minute walk test in patients with primary pulmonary hypertension:
comparison with cardiopulmonary exercise testing. Am J Respir Crit Care
Med. 2000;161:487– 492.
6. Baker SG, Kramer BS. A perfect correlate does not a surrogate make.
BMC Med Res Methodol. 2003;3:16.
7. Prentice RL. Surrogate endpoints in clinical trials: definition and operational criteria. Stat Med. 1989;8:431– 440.
8. Ventetuolo CE, Benza RL, Peacock AJ, Zamanian RT, Badesch DB,
Kawut SM. Surrogate and combined end points in pulmonary arterial
hypertension. Proc Am Thorac Soc. 2008;5:617– 622.
9. Snow JL, Kawut SM. Surrogate end points in pulmonary arterial hypertension: assessing the response to therapy. Clin Chest Med. 2007;28:75–89.
10. Macchia A, Marchioli R, Marfisi R, Scarano M, Levantesi G, Tavazzi L,
Tognoni G. A meta-analysis of trials of pulmonary hypertension: a
clinical condition looking for drugs and research methodology. Am
Heart J. 2007;153:1037–1047.
11. Helman DL, Brown AW, Jackson JL, Shorr AF. Analyzing the short-term
effect of placebo therapy in pulmonary arterial hypertension: potential implications for the design of future clinical trials. Chest. 2007;132:764–777.
12. Galie N, Manes A, Negro L, Palazzini M, Bacchi-Reggiani ML, Branzi
A. A meta-analysis of randomized controlled trials in pulmonary arterial
hypertension. Eur Heart J. 2009;30:394 – 403.
12 Circulation Enero, 2013
13. Macchia A, Marchioli R, Tognoni G, Scarano M, Marfisi R, Tavazzi L,
Rich S. Systematic review of trials using vasodilators in pulmonary
arterial hypertension: why a new approach is needed. Am Heart J. 2010;
159:245–257.
14. Johnson KR, Freemantle N, Anthony DM, Lassere MND. LDL-cholesterol differences predicted survival benefit in statin trials by the surrogate
threshold effect (STE). J Clin Epidemiol. 2009;62:328 –336.
15. Buyse M, Molenberghs G. Criteria for the validation of surrogate endpoints in randomized experiments. Biometrics. 1998;54:1014 –1029.
16. MacKinnon DP, Dwyer JH. Estimating mediated effects in prevention
studies. Eval Rev. 1993;17:144 –158.
17. Burzykowski T, Buyse M. Surrogate threshold effect: an alternative
measure for meta-analytic surrogate endpoint validation. Pharm Stat.
2006;5:173–186.
18. Simonneau G, Barst RJ, Galie N, Naeije R, Rich S, Bourge RC, Keogh A,
Oudiz R, Frost A, Blackburn SD, Crow JW, Rubin LJ. Continuous
subcutaneous infusion of treprostinil, a prostacyclin analogue, in patients
with pulmonary arterial hypertension: a double-blind, randomized,
placebo-controlled trial. Am J Respir Crit Care Med. 2002;165:800 – 804.
19. Galie N, Olschewski H, Oudiz RJ, Torres F, Frost A, Ghofrani HA,
Badesch DB, McGoon MD, McLaughlin VV, Roecker EB, Gerber MJ,
Dufton C, Wiens BL, Rubin LJ. Ambrisentan for the treatment of pulmonary arterial hypertension: results of the Ambrisentan in Pulmonary
Arterial Hypertension, Randomized, Double-Blind, Placebo-Controlled,
Multicenter, Efficacy (ARIES) Study 1 and 2. Circulation. 2008;117:
3010 –3019.
20. Rubin LJ, Badesch DB, Barst RJ, Galie N, Black CM, Keogh A, Pulido T,
Frost A, Roux S, Leconte I, Landzberg M, Simonneau G. Bosentan therapy
for pulmonary arterial hypertension. N Engl J Med. 2002;346:896–903.
21. Olschewski H, Simonneau G, Galie N, Higenbottam T, Naeije R, Rubin
LJ, Nikkho S, Speich R, Hoeper MM, Behr J, Winkler J, Sitbon O, Popov
W, Ghofrani HA, Manes A, Kiely DG, Ewert R, Meyer A, Corris PA,
Delcroix M, Gomez-Sanchez M, Siedentop H, Seeger W; the Aerosolized
Iloprost Randomized Study Group. Inhaled iloprost for severe pulmonary
hypertension. N Engl J Med. 2002;347:322–329.
22. Barst RJ, Langleben D, Frost A, Horn EM, Oudiz R, Shapiro S,
McLaughlin V, Hill N, Tapson VF, Robbins IM, Zwicke D, Duncan B,
Dixon RAF, Frumkin LR. Sitaxsentan therapy for pulmonary arterial
hypertension. Am J Respir Crit Care Med. 2004;169:441– 447.
23. Barst RJ, Langleben D, Badesch D, Frost A, Lawrence EC, Shapiro S,
Naeije R, Galie N. Treatment of pulmonary arterial hypertension with the
selective endothelin-A receptor antagonist sitaxsentan. J Am Coll
Cardiol. 2006;47:2049 –2056.
24. Galie N, Ghofrani HA, Torbicki A, Barst RJ, Rubin LJ, Badesch D,
Fleming T, Parpia T, Burgess G, Branzi A, Grimminger F, Kurzyna M,
Simonneau G; Sildenafil Use in Pulmonary Arterial Hypertension Study
Group. Sildenafil citrate therapy for pulmonary arterial hypertension.
N Engl J Med. 2005;353:2148 –2157.
25. Galie N, Brundage BH, Ghofrani HA, Oudiz RJ, Simonneau G, Safdar Z,
Shapiro S, White RJ, Chan M, Beardsworth A, Frumkin L, Barst RJ.
Tadalafil therapy for pulmonary arterial hypertension. Circulation. 2009;
119:2894 –2903.
26. Klebanoff MA, Cole SR. Use of multiple imputation in the epidemiologic
literature. Am J Epidemiol. 2008;168:355–357.
27. Freedman LS, Graubard BI, Schatzkin A. Statistical validation of intermediate end-points for chronic diseases. Stat Med. 1992;11:167–178.
28. Huang J, Huang B. Evaluating the proportion of treatment effect
explained by a continuous surrogate marker in logistic or probit
regression models. Stat Biopharm Res. 2010;2:229 –238.
29. Efron B, Tibshirani RJ. An Introduction to the Bootstrap. New York, NY:
Chapman and Hall; 1993.
30. Jasti S, Dudley WN, Goldwater E. SAS macros for testing statistical
mediation in data with binary mediators or outcomes. Nurs Res. 2008;
57:118 –122.
31. Gabler NB, French B, Strom BL, Liu Z, Palevsky HI, Taichman DB,
Kawut SM, Halpern SD. Race and sex differences in response to endothelin receptor antagonists for pulmonary arterial hypertension. Chest.
2012;141:20 –26.
32. Kuhn KP, Byrne DW, Arbogast PG, Doyle TP, Loyd JE, Robbins IM.
Outcome in 91 consecutive patients with pulmonary arterial hypertension
receiving epoprostenol. Am J Respir Crit Care Med. 2003;167:580 –586.
33. Lassere MN. The biomarker-surrogacy evaluation schema: a review of
the biomarker-surrogate literature and a proposal for a criterion-based,
quantitative, multidimensional hierarchical levels of evidence schema for
evaluating the status of biomarkers as surrogate endpoints. Stat Methods
Med Res. 2008;17:303–340.
34. Rasekaba T, Lee AL, Naughton MT, Williams TJ, Holland AE. The
six-minute walk test: a useful metric for the cardiopulmonary patient.
Intern Med J. 2009;39:495–501.
35. Echt DS, Liebson PR, Mitchell LB, Peters RW, Obias-Manno D, Barker
AH, Arensberg D, Baker A, Friedman L, Greene HL, Huther ML, Richardson DW; CAST Investigators. Mortality and morbidity in patients
receiving encainide, flecainide, or placebo: the Cardiac Arrhythmia Suppression Trial. N Engl J Med. 1991;324:781–788.
36. du Bois RM, Weycker D, Albera C, Bradford WZ, Costabel U, Kartashov
A, Lancaster L, Noble PW, Sahn SA, Szwarcberg J, Thomeer M, Valeyre
D, King TE Jr. Six-minute-walk test in idiopathic pulmonary fibrosis: test
validation and minimal clinically important difference. Am J Respir Crit
Care Med. 2011;183:1231–1237.
37. Redelmeier DA, Bayoumi AM, Goldstein RS, Guyatt GH. Interpreting
small differences in functional status: the six minute walk test in chronic
lung disease patients. Am J Respir Crit Care Med. 1997;155:1278 –1282.
38. Hamilton DM, Haennel RG. Validity and reliability of the 6-minute walk
test in a cardiac rehabilitation population. J Cardiopulm Rehabil. 2000;
20:156 –164.
39. Fleming TR, DeMets DL. Surrogate end points in clinical trials: are we
being misled? Ann Intern Med. 1996;125:605– 613.
40. Gilbert C, Brown MC, Cappelleri JC, Carlsson M, McKenna SP. Estimating a minimally important difference in pulmonary arterial hypertension following treatment with sildenafil. Chest. 2009;135:137–142.
41. Paciocco G, Martinez FJ, Bossone E, Pielsticker E, Gillespie B, Rubenfire
M. Oxygen desaturation on the six-minute walk test and mortality in
untreated primary pulmonary hypertension. Eur Respir J. 2001;17:
647– 652.
42. Buyse M, Molenberghs G, Burzykowski T, Renard D, Geys H. The
validation of surrogate endpoints in meta-analyses of randomized experiments. Biostatistics. 2000;1:49 – 67.
43. Halpern SD, Doyle R, Kawut SM. The ethics of randomized clinical trials
in pulmonary arterial hypertension. Proc Am Thorac Soc. 2008;5:
631– 635.
PERSPECTIVA CLÍNICA
Este estudio pone de manifiesto que el cambio de la distancia recorrida en 6 minutos (6MWD) satisface los criterios estadísticos de un factor mediador entre el tratamiento farmacológico y los resultados clínicos en los ensayos clínicos aleatorizados.
Se identificaron umbrales del cambio de la 6MWD para los que se considera que si futuros fármacos produjeran tales cambios, podría inferirse que dichos fármacos producirían también efectos clínicos. Es posible que sean necesarios umbrales más
altos de 6MWD al evaluar nuevos fármacos en presencia de un tratamiento de base para la hipertensión arterial pulmonar; sin
embargo, nuestros resultados indican que probablemente la 6MWD no sea adecuada para el uso como variable de valoración
sustitutiva en los ensayos clínicos en la hipertensión arterial pulmonar, ya que tan solo una parte modesta del efecto de los
fármacos sobre los resultados clínicos reales se explica por los cambios de la 6MWD. Serán necesarias nuevas investigaciones
para identificar variables de valoración sustitutivas o combinaciones de ellas que sean más sólidas.