Em um mundo de 140 caracteres, as vezes eu preciso de um pouco mais do que isso pra expressar meus pensamentos... ou não...

Em 140 caracteres, eu disse...

Tardo, mas não falho…

Pois é, demorou bem mais do que eu previ, mas aqui vai. Estou oficialmente aceito no mestrado da USP de São Carlos!!!

Pois é, resolvi continuar os estudos na área de mineração de texto. Vamos ver onde isso vai dar.

Por falar em novidades, o atraso foi providencial. Também saiu o resultado do CAPES, e a UNIFEI vai ter o seu mestrado em Ciência e Tecnologia da Computação! Parabéns aos professores que batalharam por esse mestrado.

Bem, vamos a mais dois anos de estudo… acho que vou precisar de mais café pra aguentar…

Papai noel, você roe as unhas?

Alô você!

Aos poucos vou colocando a casa em ordem. Primeiro a formatura, depois a empresa, e agora vou voltar a pensar no blog.

Estou acompanhando o blog da Nospheratt, agora de casa nova, e ela está fazendo uma série (ela arrumou post até o natal, a idéia foi ótima…) onde ela propõe 21 ações simples para os bogueiros realizarem até o natal, visando arrumar a casa. A série já está no dia 6, o que me motivou a criar este post. Chegou a hora de enfeitar nossas casa, árvores e blogs para o natal, e eu vou dar uma ajeitadinha no layout atual para isso.

Essa ação começou a me motivar a repensar (afinal, estamos na época de prometer mudanças) o layout deste blog, para começar o ano novo com casa nova. A idéia acabou de ganhar vida, e ainda vai precisar de chão para ganhar forma. Mas estou me motivando, ainda mais depois de ver o trabalho feito no tableless, que ficou bem legal, apesar de agora ter perdido a “cara de blog” que tinha antes.

Eu estava pra fazer este post amanhã, pois tenho uma novidade não oficial que gostaria de anunciar. Mas agora, já tenho o que postar amanhã! :d

Então, volto logo, com mais novidades.

P.S.: Ainda estou pensanso se, e como, vou publicar meu trabalho final de graduação. Mas aguarde na linha, sua ligação é importante para nós…

Café?

Formatura, mineração de textos e outras coisas

Pois é, eu sumi. De novo.
Mas dessa vez foi por um bom motivo. Eu estava ocupado trabalhando no meu trabalho de conclusão de curso, e finalmente está acabado, apresentado, e estou aprovado. O título do trabalho foi “Algoritmo de text mining para análise de textos financeiros”. Já havia falado disso aqui antes. Minha intenção é começar a publicar o que eu vi no trabalho aos poucos por aqui, pois é bastante conteúdo.

A formatura está finalmente chegando, e é hora de traçar planos pro futuro. Estou investindo pesado na área de outsourcing de TI com a Surreallis, uma empresa incubada que estou trabalhando com outros sócios. Ainda vou dominar o mundo!!!! Também estou com idéias para o mestrado…vejamos onde isso tudo vai dar.

As outras coisas eu não sei. O google lançou o Android, e vai dar 10 milhões em prêmios para os projetos que forem inovadores para a plataforma. A lenda do googlephone foi por água a baixo, acredito eu. A Apple continua por ai, a microsoft vem com o Zune novo… enfim… a vida segue seu rumo.

Vai uma xícara de café?

Dinheiro não traz felicidade

Monetizar o blog. Todo blogueiro que resolve passar para uma experiência minimamente mais séria visita assunto uma vez na vida. Esse assunto é a Meca da vez pra quem está no mundo digital. Eu pensei muito, muito, e resolvi começar a fazer isso por aqui. Sinceramente falando, não sei se vale a pena ainda, nem mesmo se é o que eu quero, mas resolvi testar esse modelo.

Em primeiro lugar, sei que ainda não é o “momento certo” para isso por aqui, pois meu site não tem um número que seja suficientemente aceitável de visitantes para justificar esse tipo de estratégia. Depois, eu não consigo criar uma frequência de postagem que atraia muita gente pra cá, e a frequência da atualização é definitivamente um fator chave no mundo monetizado de hoje.

Aliás, esse blog sequer adquiriu uma cara do que ele vai ser. Ele surgiu pela simples vontade que eu tinha de ter meu site, de ter um espaço meu na web (esse mundo virtual que eu acabei curtindo), e de falar sobre coisas que eu gosto (basicamente tecnologia). Mas acho que toda pessoa que “mexe com pc” escreve um blog sobre tecnologia, então essa é uma concorrência desleal. Como minha formação é nessa área, fica um pouco complicado buscar outros nichos no momento.

Bem, apesar de tudo que eu falei acima, resolvi testar um pouco essa onda de monetizar blogs. Comecei pelo mais básico dos básicos, o AdSense do google. Minha intenção no momento não é gerar dinheiro (mas seria bom né?), e sim conhecer, ver como funciona, como usar… Ainda pretendo conhecer alguns programas de afiliados, mas vamos com calma.

Acho que este post foi mais uma reflexão sobre ter ou não ter propagandas espalhadas pelo blog. Vamos ver no que isso vai dar.

Enquanto isso, na sala da justiça…O google diz que vai avaliar a qualidade dos clicks, e pagar pelos que realmente se tornem “venda”… (Fonte: Nospherat, excelente blog pra quem deseja blogar)

Bem, ainda preciso decidir sobre o que é esse blog… uma linha que venho desenvolvendo, inclusive no meu TCC, é a utilização de técnicas avançadas de Data Mining… Mas ainda preciso amadurecer isso (e terminar o TCC)…

No mais, vou tomar um chá hoje… aceita?

Matando dois links com um post só

Pois é, estou matando dois links que me enviaram, pra não deixar o blog morrer.

No primeiro caso, um meme que o Rochester me passou… “Você é um blogueiro Anti-social?”… um meme que (quase) não passa links pros outros…

Fico pensando, eu não saio muito mesmo, acabo ficando em casa, ou na empresa. Já sai mais, mas tenho ficado em casa, principalmente porque minha namorada não mora por aqui, e “dá-lhe” skype… Além disso, acabo passando 90% do meu dia na frente do pc, ossos do ofício. MSN ligado o tempo todo, e sou mais social na vida online.

Resumo: Estou anti-social, mas na prática não ligo tanto para isso… e tenho que sair um pouco da frente do pc.

Continuando o post, veio um link de uma discussão que está rolando no SEO Dicas (excelente site, o pessoal lá está discutindo ótimas dicas de SEO), perguntando o que eu acho sobre usar imagem ou texto logo no cabeçalho do site. Bem, lendo no comentário, vi um do próprio Fábio (o chefe da turma) falando que a idéia original proposta era um imagem replacement, o que é um black hat. Mas o que foi proposto no texto não é isso, é simplesmente escolher entre ter o texto (o que é bom para mecanismos de busca) ou a imagem logo no topo do site. Eu não acho que isso possa ser caracterizado como uma técnica ruim, desde que não faça uso de algo sujo, como esconder texto com a cor do fundo. Na prática, sei que isso não vai acontecer, e a tentação de fazer algo vai ser maior. Além disso, o uso de imagem enriquece o layout… Bem, não sei se consegui explicar, mas é isso… Não acho uma técnica ruim, mas como a tentação de usar esse cabeçalho pra otimizar vai ser mais forte, não recomendo… :-)

Pessoalmente, até acho que isso não vá ajudar muito. O Google utiliza IA para analisar os sites, e entre os testes, ele é capaz de (em grande parte dos casos) entender o “comportamento natural”, e aquele que é forçado. Como a técnica acima não é muito natural nos sites, acho que ele pode atrapalhar, ao invés de ajudar.


No mais, vale citar que estou testando o uso do Zoundry para escrever esse post. Estou gerenciando todos os blogs (uau, parece que tenho uma rede gigante, não?) daqui. Vale a dica, um ótimo programa O Cardoso fez um ótimo resumo dele, no contraditorium.

Bem, deixa eu tomar um chá, e ir dormir… Café a essa hora não é bom.

Mais maratona

O Fábio fez um artigo sobre a participação da UNIFEI na XII Maratona de programação (que eu falei antes). Vale conferir.

Não vai dar tempo nem pro cafezinho… fui!!!

Maratona de programação

Mais um pouco da minha vida corrida. Amanhã cedo estou indo para Taubaté disputar a primeira fase da XII Maratona de programação. Na verdade verdadeira, eu vou como reserva da equipe, mais como um “apoio moral” :D .

As expectativas das 5 equipes da UNIFEI são muito boas. Vamos ver no que vai dar. Boa sorte pra todos nós.

Notícias do poscomp: Foi muito legal, valeu a pena ter feito, mesmo sem ter estudado muito para a prova (acabei decidindo por fazer a prova só no meio desse ano…). No geral, a prova foi muito difícil e cansativa, por conta do estilo que eles adotam para a prova. Vamos ver o resultado…

Bem, agora é tomar aquela xícara de café para agitar a prova amanhã… FUI!!!

Poscomp

Nesse instante estou nos ultimos preparativos para o Poscomp. Vamos tentar continuar os estudos em text mining… quem sabe eu não sou o próximo google que o presidente da sun falou.

E boa sorte pra todos nós… :D

Conclusão de curso

Esse final de semestre estou ralando para terminar meu curso de ciência da computação (breve, portal do curso… uma das tarefas para que eu me forme). E o que me faz escrever esse texto é o tema que estou abordando.
Resolvi utilizar uma técnica chamada text mining. No meu caso, eu estou trabalhando em cima de web mining. Em uma explicação bem rápida, é a utilização de técnicas de data mining para explorarmos a web, e tentar obter algum resultado. O web mining é dividido basicamente em três linhas de trabalho:

  • Mining de conteúdo: é a mineração que analisa a informação que temos disponível nas páginas.
  • Mining da estrutura: é a exploração da estrutura da web, ou seja, a forma como as páginas são interligadas por hyperlinks, formando um grafo.
  • Mining do uso: é a mineração dos dados gerados por logs (pode ser o próprio log do servidor, ou algum tipo de log que você procure gerar), que podem dar importantes informações sobre as preferências dos usuários.

A minha preocupação atual é com o mining do conteúdo. Milhares de pesquisas podem ser encontradas mostrando que o homem tem uma infinidade de informação gerada em um formato que chamamos de “linguagem natural”, ou seja, a linguagem que você usa pra falar e pra escrever.
Apesar da linguagem natural ser muito utilizada, não é uma linguagem que as máquinas podem usar para trabalhar. Isso é um problema sério, pois estima-se que 80% de tudo que produzimos de conhecimento está em linguagem natural, inacessível a máquinas, e logo, inacessível ao “poder de processamento computacional”.
Nessa área temos a atuação do text mining, que é uma técnica que visa “ler” um texto, e extrair informações importantes para que as máquinas possam fazer tratamento desses dados. Ou seja, na web, encontramos a maior parte do conhecimento humano disponível. As ferramentas de busca (vide google, yahoo, msn search,…) nos permitem localizar boa parte dele, e portanto, podemos dar “ordem do caos”.
Em linhas gerais, apenas queria apresentar isso, e quando meu trabalho ficar mais maduro, apresento mais informações aqui.
Antes de terminar, gostaria de citar um ótimo exemplo de ferramenta de web mining: o Google.
Sim, o google nasceu de com uma proposta de organizar o conteúdo da web. Em sua tese de graduação, os fundadores do google apresentam nada mais que algumas “sacadas boas” para encontrar, organizar e tornar acessível a informação da web. Claro que não estou desprezando o trabalho deles, tem muita idéia genial ali, por isso o segredo bem guardado. Mas começo a descobrir que eles não estão tão distante da humanidade quanto parece.
A sim, o google é uma ferramenta basicamente de mining de estrutura, depois de utilizar a estrutura para encontrar e classificar as páginas, eles fazem um mining de conteúdo, e refinam o trabalho realizado antes.
Bem, chega por hoje, pois acho que mais confudi do que expliquei. Vou mesmo é pegar um café pra trabalhar mais um pouco… até mais….

Rapidinha do dia

Meu meme abaixo acabou fazendo a vez do blogday. Viva ao meu retorno casual coincidente twist carpado.