Picture of Pedro Patinho
Re: Mais dúvidas no trabalho.
by Pedro Patinho - Terça, 28 Junho 2005, 12:48
 
Não, estão a calcular bem...

O erro foi meu, em ter chamado probabilidade, para simplificar...

Na prática, o que temos não é uma probabilidade, mas o logaritmo da probabilidade.

Os logs são usados para acelerar o processamento, usando somas em vez de multiplicações, aproveitando o facto de log(A*B) = log(A)+log(B), para além de reduzirem os erros associados a não considerarmos algumas variáveis.

Para os fundamentos teóricos, que eu não pretendo que conheçam no âmbito da cadeira, mas podem dar uma vista de olhos, leiam este recurso.

Resumindo,
log(P(X em C1)) = -1,67440181285
log(P(X em C2)) = -4,54406804436

então é mais provável que o texto esteja na categoria 1, pois o valor é maior. Notem que estes valores serão sempre negativos, pois log(1)=0, logo log(P(X))<0 se P(X)<1, o que acontece sempre, no nosso caso.



Picture of Bruno Almeida
Re: Mais dúvidas no trabalho.
by Bruno Almeida - Quinta, 7 Julho 2005, 02:23
 
No enunciado está escrito: "Em caso de falha, é necessário dar mais treino ao sistema". Quando é que acontece este caso?

Bruno Almeida
João Taleço
Picture of Pedro Patinho
Re: Mais dúvidas no trabalho.
by Pedro Patinho - Sexta, 8 Julho 2005, 09:02
 
É apenas uma reflexão...

Se tentamos classificar um texto e o sistema diz que o texto pertence a uma categoria errada ("falha"), é porque necessitamos de mais treino.