Introdução
O texto a seguir é a primeira parte de uma sequência de dois artigos. Nesse primeiro momento, serão abordados os conceitos básicos necessários para entender a gestão de carteiras baseada na Teoria Moderna do Portfólio [0]. Um portfólio (ou carteira) é um conjunto de ativos que um investidor possui, no qual podem ser calculados o retorno esperado, o risco e formas de otimizar essa relação. Os conceitos básicos de estatística ajudam a descrever tais parâmetros de uma carteira. Embora muitas vezes sejam apresentados de forma teórica, os mesmos serão explicados de forma mais intuitiva para o leitor que nunca teve contato com os tópicos.
Retorno
O retorno de uma ação é dado por um simples cálculo de porcentagem. Se o preço de uma ação estiver cotado a R$ 40 no momento da compra e R$ 45 no momento da venda, sua rentabilidade será igual ao quanto o preço mudou em relação ao preço da compra, resultando em:
Esse é descrito como o retorno simples ou linear. Porém, é importante ressaltar dois pontos, que caso o leitor não esteja familiarizado, serão explicados de forma sucinta.
Os dividendos da ação devem estar incluídos no retorno calculado. Logo, na hora de coletar os preços do ativo é importante selecionar o preço de fechamento ajustado (adjusted close), que é o preço que inclui uma ocasional distribuição de dividendos.
O cálculo do retorno mais apropriado para utilizar nos conceitos que serão apresentados em seguida deve ser o retorno logarítmico [1].
Apesar do cálculo diferente, o objetivo por trás é o mesmo: calcular o quanto o preço variou entre a compra e venda. Caso o preço inicial seja R$ 40 e o final R$ 45, o retorno logarítmico é igual à:
Se comparado ao retorno simples, observa-se que os valores são próximos.
Retorno Esperado
Supondo que uma sala de Macroeconomia I teve uma prova. O professor no dia seguinte postou as notas de 20 alunos, registradas a seguir:
É possível reparar que existe uma maior concentração de notas entre 3 e 4. Supondo que mais um aluno aleatório tenha a nota de sua prova publicada, é possível deduzir que essa nota é algo próximo de 3,5. Essa intuição faz sentido e na estatística existe uma forma de formalizar isso e usar na projeção do retorno de um ativo.
Uma das formas é utilizar a média, uma medida de tendência central [2]. A média das notas dessa sala é 3,9. Ou seja, o palpite é traduzido de forma próxima no cálculo da média.
A fórmula do retorno esperado é justamente a média dos retornos:
Porém é necessário avaliar bem a amostra dos retornos. Voltando ao exemplo da sala de aula, supondo que a nota publicada mencionada foi 9. É algo improvável seguindo as outras notas da sala, mas possível. Porém, agora supondo que mais 10 notas foram publicadas e todas pontuadas acima de 8. A um primeiro momento pode não fazer sentido, porém se a sala contiver 150 alunos, 20 notas pode não ser uma amostra boa. É possível que as 20 primeiras provas corrigidas fossem as primeiras entregues por alunos que não estudaram e que então, entregaram nos primeiros minutos.
Existem muitas variáveis que devem ser pensadas ao coletar os dados da sua amostra, e isso é análogo aos retornos. Retornos dos últimos 5 dias dificilmente representam bem o comportamento de um ativo. Utilizar retornos de ações entre fevereiro/2020 e março/2020, período cujo houve uma grande queda do preço de ativos devido ao Coronavírus, também não representa de forma adequada os retornos de uma ação, por ser uma situação atípica.
Risco
Supondo um exemplo parecido com o da sala de Macroeconomia I, porém agora com as notas de duas salas do mesmo professor lecionando essa matéria. Ambas têm 100 alunos cada e por enquanto, foram disponibilizadas 50 notas de cada sala, que foram corrigidas em ordem aleatória. Percebe-se que a amostra de cada sala aparenta ser adequada para representar as notas dela. A tabela a seguir mostra quantos alunos tiraram cada nota por sala:
A próxima nota publicada esperada de cada sala é a mesma para ambas, seguindo a lógica de que a média traz uma boa estimativa. Ambas seriam algo entre 5 e 6. Porém, comparando o quão concentrado as notas estão, é mais provável que a próxima nota publicada seja algo em torno da média na sala 2. Os dados na segunda sala estão mais concentrados ao redor da média se comparado a primeira.
No caso dos retornos, não é prático fazer uma análise como essa de forma intuitiva. Porém, existe uma forma de medir quanto dispersos estão os dados em uma amostra: a variância. Tal medida é interpretada como uma forma de quantificar o risco dos retornos de um ativo. Quanto maior a variância maior o risco, pois os dados estão mais dispersos da média, assim demonstrando que o ativo tem chances maiores de apresentar retornos muito diferentes do retorno esperado.
A fórmula do risco de um ativo será dado por:
Análogo aos retornos de um ativo, a primeira sala apresentou uma variância de 6,38, enquanto a segunda 3,15. Ou seja, o risco da próxima nota estar distante de 5,5 é maior na primeira sala.
É possível usar o desvio padrão dos retornos como medida de risco, afinal, sua fórmula é dada pela raiz quadrada da variância. Porém, é importante utilizar a mesma medida de dispersão [3] quando comparar o risco entre diferentes ativos.
Conclusão
O conteúdo apresentado é introdutório em estatística, mas foi apresentado sem o rigor teórico de livros necessários para quem deseja se aprofundar no assunto. Porém, mesmo apresentado de forma mais intuitiva, o conteúdo serve de base para o próximo artigo em que de fato, será explicado o que é a Teoria Moderna do Portfólio.
Notas
[0] A Teoria Moderna do Portfólio, que teve seus fundamentos publicados por Harry Markowitz, é um modelo de construção de carteiras de investimento a partir da análise de dados.
[1] Retornos logarítmicos são usados para facilitar o cálculo do retorno acumulado, pois basta somar os retornos logarítmicos de cada período em um intervalo. Além disso, existe a questão estatística da distribuição dos retornos que pode ser encontrada em: BODIE, Z. KANE, A.; MARCUS, A. Investments. McGraw-Hill Irwin, 2009. 10ª edição (pg. 152-154).
[2] Medidas de tendência central informam um valor que os outros giram em torno. Outros exemplos são moda e mediana.
[3] Medidas de dispersão como a variância e desvio padrão informam um grau de variabilidade de uma amostra ou população.