+ Responder ao Tópico



  1. Olá pessoal,
    tenho vários arquivos HTML q preciso transformar em TXT mas sem as TAGS (sem os comandos html´s - Só o conteúdo da página). Tem como fazer isto no linux?
    Desde já, agradeço a colaboração de todos.
    []´s,
    Savio



  2. Utilize o navegador texto "Lynx":

    Código :
    $ lynx -dump arquivo.html > arquivo.txt

    Uma pequena ajudinha pra facilitar se vc tiver vários arquivos html a serem convertidos em um diretório:

    Código :
    $ for i in *.html ; do lynx -dump "$i" > "`basename "$i" .html`.txt" ; done

    :wink:



  3. #3
    hez4el
    usa o seguinte procedimento

    $arquivo = file("nome do arquivo");

    for($x=0; $x<count(arquivo); $x++){
    $arquivo[$x] = strip_tags($arquivo[$x]);
    }

    depois é só salvar a variavel $arquivo dentro do "nome do arquivo"
    linha por linha usando fwrite()

    Abraços






Tópicos Similares

  1. Txt para Html
    Por cldn no fórum Linguagens de Programação
    Respostas: 2
    Último Post: 28-09-2009, 14:02
  2. Apagar dados de Arquivo TXT
    Por gustavo_marcon no fórum Servidores de Rede
    Respostas: 0
    Último Post: 09-04-2003, 14:17
  3. Transformar HTML em TXT
    Por ghenri no fórum Servidores de Rede
    Respostas: 2
    Último Post: 11-02-2003, 07:52
  4. Editor de Html
    Por Bruno no fórum Servidores de Rede
    Respostas: 5
    Último Post: 20-12-2002, 10:22
  5. Extensões html é htm
    Por Good_speed no fórum Servidores de Rede
    Respostas: 1
    Último Post: 06-10-2002, 10:53

Visite: BR-Linux ·  VivaOLinux ·  Dicas-L