Este estudo explora estratégias para o aprimoramento do raciocínio clínico, enfatizando sua integração sistemática no currículo de graduação e a redução de erros diagnósticos. A reflexão deliberada (RD) é apresentada como uma ferramenta eficaz tanto para melhorar o desempenho diagnóstico quanto para o ensino do raciocínio clínico. Foram analisados três formatos de RD: livre, guiada e modelada, variando no nível de orientação oferecido aos alunos. O objetivo do estudo foi avaliar a diferença no desempenho diagnóstico, confiança e desenvolvimento do raciocínio clínico a longo prazo em estudantes do sexto ano de medicina da FCM/UNICAMP, utilizando diferentes estratégias educacionais combinadas com RD em casos previamente estudados e novos. A hipótese formulada foi que o grupo exposto a múltiplos métodos de RD demonstraria maior retenção a longo prazo e melhor desempenho em casos previamente estudados, em comparação com o grupo exposto a um único método de reflexão. O tamanho amostral foi calculado utilizando o G* Power, com um alfa de 0,05, poder de 0,8 e tamanho de efeito de 0,20 para análise de variância com medidas repetidas, resultando na necessidade de 52 alunos, com adição de 20 para perdas, totalizando 63 alunos. No total, 49 estudantes foram randomizados em dois grupos. Ambos realizaram RD em seis casos clínicos envolvendo duas patologias com apresentações clínicas semelhantes. O grupo de método único realizou a RD de forma guiada, enquanto o grupo de múltiplos métodos utilizou RD modelada, guiada e livre, respectivamente. Após 15 dias, ambos os grupos diagnosticaram e indicaram sua confiança em oito novos casos clínicos, quatro deles variações dos casos previamente estudados e quatro envolvendo novas doenças. Os resultados não mostraram diferenças significativas entre os grupos de método único e múltiplos métodos quanto à acurácia diagnóstica (p=0,719), confiança (p=0,127) e unidades de ideias (p=0,425). No entanto, observou-se maior acurácia diagnóstica em casos de doenças adjacentes (p=0,005) e maior confiança (p=0,031) e unidades de ideias corretas (p<0,001) em casos previamente estudados. A comparação de diagnósticos alternativos durante a reflexão sobre um caso melhora as representações mentais das doenças analisadas, favorecendo a distinção de doenças relacionadas em futuros casos semelhantes.