[ < ] | [ > ] | [ << ] | [ Up ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
73.1 Introdução a manipulação de seqüências de caracteres | ||
73.2 Funções e Variáveis para entrada e saída | ||
73.3 Funções e Variáveis para caracteres | ||
73.4 Funções e Variáveis para seqüências de caracteres |
[ < ] | [ > ] | [ << ] | [ Up ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
O arquivo stringproc.lisp
amplia a compatibilidade do Maxima de trabalhar com seqüências de caracteres
e adiciona algumas funções úteis a entrada e saída de dados.
Para esclarecimentos e correções por favor mande um e-mail para van.nek at arcor.de .
No Maxima uma seqüência de caracteres é facilmente contruída digitando "texto" (qualquer texto desejado entre aspas duplas).
Note que seqüências de caracteres do Maxima não são seqüências de caracteres do Lisp e vice-versa.
stringp
realiza testes para seqüências de caracteres
do Maxima, e lstringp
realiza testes para seqüências de caracteres do Lisp.
Se por alguma razão voce tiver um valor,
que é uma seqüência de caracteres do Lisp, talvez quando estiver usando a função sconcat
do Maxima, você pode converter via sunlisp
.
(%i1) m: "text"; (%o1) text (%i2) [stringp(m),lstringp(m)]; (%o2) [true, false] (%i3) l: sconcat("text"); (%o3) text (%i4) [stringp(l),lstringp(l)]; (%o4) [false, true] (%i5) stringp( sunlisp(l) ); (%o5) true
Todas as funções em stringproc.lisp
, que retornarem seqüências de caracteres, retornam seqüências de caracteres do Maxima.
Caracteres são introduzidos como seqüências de caracteres do Maxima de comprimento 1.
Com certeza, esses caracteres não são caracteres do Lisp.
Testes podem ser realizados com charp
( lcharp
e conversões do Lisp para o Maxima com cunlisp
).
(%i1) c: "e"; (%o1) e (%i2) [charp(c),lcharp(c)]; (%o2) [true, false] (%i3) supcase(c); (%o3) E (%i4) charp(%); (%o4) true
Novamente, todas as funções em stringproc.lisp
, que retornam caracteres, retornam caracteres do Maxima.
devido a esse fato, que os caracteres introduzidos são seqüências de caracteres comprimento 1,
você pode usar muitas das funções de seqüência de caracteres também para caracteres.
Como visto, supcase
é um exemplo.
É importante saber,
que o primeiro caractere em uma seqüência de caracteres do Maxima éstá na posição 1.
Isso é designado devido ao fato de o primeiro elemento em uma lista do Maxima está na posição 1 também.
Veja definições de charat
e de charlist
para obter exemplos.
Em aplicações fnções de seqüência de caractere são muitas vezes usadas quando estamos trabalhando com arquivos.
Você encontrará algumas úteis funções de fluxo e funções de impressões em stringproc.lisp
.
O seguinte exemplo mostra algumas das funções aqui introduzidas no trabalho.
Exemplo:
openw
retorna um fluxo de saída para um arquivo, printf
então permite escrita formatada
para esse arquivo. Veja printf
para detalhes.
+(%i1) s: openw("E:/file.txt"); +(%o1) #<output stream E:/file.txt> +(%i2) for n:0 thru 10 do printf( s, "~d ", fib(n) ); +(%o2) done +(%i3) printf( s, "~%~d ~f ~a ~a ~f ~e ~a~%", 42,1.234,sqrt(2),%pi,1.0e-2,1.0e-2,1.0b-2 ); +(%o3) false +(%i4) close(s); +(%o4) true
Após fechar o fluxo você pode abrí-lo novamente, dessa vez com direção de entrada.
readline
retorna a linha completa como uma seqüência de caracteres. O pacote stringproc
agora oferece muitas funções para manipulação de seqüências de caracteres. A troca de indicações/fichas pode ser realizada por
split
ou por tokens
.
(%i5) s: openr("E:/file.txt"); (%o5) #<input stream E:/file.txt> (%i6) readline(s); (%o6) 0 1 1 2 3 5 8 13 21 34 55 (%i7) line: readline(s); (%o7) 42 1.234 sqrt(2) %pi 0.01 1.0E-2 1.0b-2 (%i8) list: tokens(line); (%o8) [42, 1.234, sqrt(2), %pi, 0.01, 1.0E-2, 1.0b-2] (%i9) map( parsetoken, list ); (%o9) [42, 1.234, false, false, 0.01, 0.01, false]
parsetoken
somente analiza números inteiros e em ponto flutuante. A análise de símbolos ou grandes números em ponto flutuante
precisa de parse_string
, que irá ser disponibilizada para uso automaticamente através de eval_string.lisp
.
(%i10) map( parse_string, list ); (%o10) [42, 1.234, sqrt(2), %pi, 0.01, 0.01, 1.0b-2] (%i11) float(%); (%o11) [42.0, 1.234, 1.414213562373095, 3.141592653589793, 0.01, 0.01, 0.01] (%i12) readline(s); (%o12) false (%i13) close(s)$
readline
retorna false
quado o fim de arquivo acontecer.
[ < ] | [ > ] | [ << ] | [ Up ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
Exemplo:
(%i1) s: openw("E:/file.txt"); (%o1) #<output stream E:/file.txt> (%i2) control: "~2tAn atom: ~20t~a~%~2tand a list: ~20t~{~r ~}~%~2tand an integer: ~20t~d~%"$ (%i3) printf( s,control, 'true,[1,2,3],42 )$ (%o3) false (%i4) close(s); (%o4) true (%i5) s: openr("E:/file.txt"); (%o5) #<input stream E:/file.txt> (%i6) while stringp( tmp:readline(s) ) do print(tmp)$ An atom: true and a list: one two three and an integer: 42 (%i7) close(s)$
Fecha fluxo e retorna true
se fluxo tiver sido aberto anteriormente.
Retorna o número de elementos em fluxo.
Retorna a posição corrente em fluxo, se pos não está sendo usada.
Se pos estiver sendo usada,
fposition
escolhe a posição em fluxo.
pos tem que ser um número positivo,
o primeiro elemento em fluxo está na posição 1.
escreve uma nova linha (em fluxo),
se a posição atual não for um início de linha.
Veja também newline
.
Escreve uma nova linha (para fluxo).
Veja sprint
para um exemplo de uso de newline()
.
Note que existem alguns casos, onde newline()
não trabalha como esperado.
Retorna um fluxo de saída para arquivo.
Se um arquivo já existente tiver sido aberto, opena
anexa os elementos ao final do arquivo.
Retorna um fluxo para arquivo. Se arquivo não existir, ele será criado.
Retorna um fluxo de saída para arquivo.
Se arquivo não existir, será criado.
Se um arquivo já existente for aberto, openw
modifica destrutivametne o arquivo.
Torna a função FORMAT do Lisp Comum disponível no Maxima. (Retirado de gcl.info: "format produces formatted output by outputting the caracteres of control-string string and observing that a tilde introduces a directive. The caractere after the tilde, possibly preceded by prefix parameters and modifiers, specifies what kind of formatting is desired. Most directives use one or more elements of args to create their output.")
A seguinte descrição e oa exemplos podem fornecer uma idéia de uso de printf
.
Veja um referência de Lisp para maiores informações.
~% nova linha ~& novíssima line ~t tabulação ~$ monetário ~d inteiro decimal ~b inteiro binário ~o inteiro octal ~x inteiro hexadecimal ~br inteiro de base b ~r soletra um inteiro ~p plural ~f ponto flutuante ~e notação científica ~g ~f ou ~e, dependendo da magnitude ~a como mostrado pela função print do Maxima ~s seqüências de caracteres entre "aspas duplas" ~~ ~ ~< justificação de texto, ~> terminador de justificação de texto ~( conversão de caixa alta/baixa, ~) terminador de conversão de caixa ~[ seleção, ~] terminador de seleção ~{ iteração, ~} terminador de iteração
Por favor note que não existe especificador de formato para grandes números em ponto flutuante. Todavia grandes números em ponto flutuante podem
simplesmente serem mostrados por meio da diretiva ~a
.
~s
mostra a seqüências de caracteres entre "aspas duplas", você pode evitar isso usando ~a
.
Note que a diretiva de seleção ~[
é indexada em zero.
Também note que existem algumas diretivas, que não trabalham no Maxima.
Por exemplo, ~:[
falha.
(%i1) printf( false, "~a ~a ~4f ~a ~@r", "String",sym,bound,sqrt(12),144), bound = 1.234; (%o1) String sym 1.23 2*sqrt(3) CXLIV (%i2) printf( false,"~{~a ~}",["one",2,"THREE"] ); (%o2) one 2 THREE (%i3) printf( true,"~{~{~9,1f ~}~%~}",mat ), mat = args( matrix([1.1,2,3.33],[4,5,6],[7,8.88,9]) )$ 1.1 2.0 3.3 4.0 5.0 6.0 7.0 8.9 9.0 (%i4) control: "~:(~r~) bird~p ~[is~;are~] singing."$ (%i5) printf( false,control, n,n,if n=1 then 0 else 1 ), n=2; (%o5) Two birds are singing.
Se dest for um fluxo ou true
, então printf
retorna false
.
De outra forma, printf
retorna uma seqüência de caracteres contendo a saída.
Retorna uma seqüência de caracteres contendo os caracteres a partir da posição corrente em fluxo até o fim de linha ou false se o fim de linha do arquivo for encontrado.
Avalia e mostra seus argumentos um após o outro `sobre uma linha' iniciando na posição mais à esquerda.
Os números são mostrados com o '-' à direita do número,
e isso desconsidera o comprimento da linha. newline()
, que irá ser chamada automaticamente a partir de stringproc.lisp
pode ser útil, se você desejar colocar uma parada de linha intermediária.
(%i1) for n:0 thru 22 do sprint( fib(n) )$ 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597 2584 4181 6765 10946 17711 (%i2) for n:0 thru 22 do ( sprint(fib(n)), if mod(n,10)=9 then newline() )$ 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597 2584 4181 6765 10946 17711
[ < ] | [ > ] | [ << ] | [ Up ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
Retorna true
se caractere for um caractere alfabético.
Retorna true
se caractere for um caractere alfabético ou um dígito.
Retorna o caractere correspondente ao código numérico ASCII int. ( -1 < int < 256 )
(%i1) for n from 0 thru 255 do ( tmp: ascii(n), if alphacharp(tmp) then sprint(tmp), if n=96 then newline() )$ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z
Retorna true
se caractere_1 e caractere_2 forem os mesmos.
como cequal
mas ignora a caixa alta/baixa.
Retorna true
se o código numérico ASCII do caractere_1 for maior que o código numérico ASCII do caractere_2.
Como cgreaterp
mas ignora a caixa alta/baixa.
Retorna true
se obj for um caractere do Maxima.
Veja na seção "Introdução a manipulação de seqüências de caracteres" para ter um exemplo.
Retorna o código numéico ASCII de caractere.
Retorna true
se o código numérico ASCII de caractere_1 for menor que o código numérico ASCII de caractere_2.
Como em clessp
ignora a caixa alta/baixa.
Retorna true
se caractere for caractere gráfico e não o caractere de espaço em branco.
Um caractere gráfico é um caractere que se pode ver, adicionado o caractere de espaço em branco.
(constituent
foi definida por Paul Graham, em ANSI Common Lisp, 1996, página 67.)
(%i1) for n from 0 thru 255 do ( tmp: ascii(n), if constituent(tmp) then sprint(tmp) )$ ! " # % ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~
Converte um caractere do Lisp em um caractere do Maxima. (Você pode não precisar dessa função.)
Retorna true
se caractere for um dígito (algarismo de 0 a 9).
Retorna true
se obj for um caractere do Lisp.
(Você pode não precisar dessa função.)
Retorna true
se caractere for um caractere em caixa baixa.
O caractere de nova linha.
O caractere de espaço em branco.
O caractere de tabulação.
Retorna true
se caractere for um caractere em caixa alta.
[ < ] | [ > ] | [ << ] | [ Up ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
Converte uma seqüência de caracteres do Lisp em uma seqüência de caracteres do Maxima. (Em geral você pode não precisar dessa função.)
Retorna true
se obj is uma seqüência de caracteres do Lisp.
(Em geral você pode não precisar dessa função.)
Retorna true
se obj for uma seqüência de caracteres do Maxima.
Veja a introdução para obter exemplos.
Retorna o n-ésimo caractere de seq_caracte. O primeiro caractere em seq_caracte é retornado com n = 1.
(%i1) charat("Lisp",1); (%o1) L
Retorna a lsita de todos os caracteres em seq_caracte.
(%i1) charlist("Lisp"); (%o1) [L, i, s, p] (%i2) %[1]; (%o2) L
parsetoken
converte a primeira ficha em seq_caracte para o correspondente número ou retorna false
se o número não puder ser determinado.
O conjunto de delimitadores para a troca de fichas é {space, comma, semicolon, tab, newline}
Nota de tradução: espaço, vírgula, ponto e vírgula, tabulação e nova linha.
(%i1) 2*parsetoken("1.234 5.678"); (%o1) 2.468
Para analizar você pode também usar a função parse_string
.
Veja a descrição no arquivo 'share\contrib\eval_string.lisp'.
Avalia seus argumentos e concatena-os em uma seqüência de caracteres.
sconc
é como sconcat
mas retorna uma seqüência de caracteres do Maxima.
(%i1) sconc("xx[",3,"]:",expand((x+y)^3)); (%o1) xx[3]:y^3+3*x*y^2+3*x^2*y+x^3 (%i2) stringp(%); (%o2) true
Retorna uma cópia de seq_caracte como uma nova seqüência de caracteres.
Como em supcase
, mas caracteres em caixa alta são convertidos para caracteres em caixa baixa.
Retorna true
se seq_caracte__1 e seq_caracte__2 tiverem o mesmo comprimento e contiverem os mesmos caracteres.
Como em sequal
mas igonara a caixa alta/baixa.
sexplode
é um apelido para a função charlist
.
simplode
takes uma lista
ou expressões e concatena-as em uma seqüência de caracteres.
Se nenhum delimitador delim for usado, simplode
funciona como sconc
e não utiliza delimitador.
delim pode ser qualquer seqüência de caracteres.
(%i1) simplode(["xx[",3,"]:",expand((x+y)^3)]); (%o1) xx[3]:y^3+3*x*y^2+3*x^2*y+x^3 (%i2) simplode( sexplode("stars")," * " ); (%o2) s * t * a * r * s (%i3) simplode( ["One","more","coffee."]," " ); (%o3) One more coffee.
Retorna uma seqüência de caracteres que é uma concatenação de substring (seq_caracte, 1, pos - 1)
,
a seqüência de caracteres seq e substring (seq_caracte, pos)
.
Note que o primeiro caractere está em seq_caracte e está na posição 1.
(%i1) s: "A submarine."$ (%i2) sconc( substring(s,1,3),"yellow ",substring(s,3) ); (%o2) A yellow submarine. (%i3) sinsert("hollow ",s,3); (%o3) A hollow submarine.
Retorna seq_caracte exceto que cada caractere da posição início até a posição fim está invertido. Se a posição fim não for fornecida, todos os caracteres do início ao fim de seq_caracte são substituídos.
(%i1) sinvertcase("sInvertCase"); (%o1) SiNVERTcASE
Retorna número de caracteres em seq_caracte.
Retorna uma nova seqüência de caracteres repetindo num vezes caractere.
(%i1) smake(3,"w"); (%o1) www
Retorna a posição do primeiro caractere de seq_caracte__1 no qual seq_caracte__1 e seq_caracte__2 diferem ou false
em caso contrário.
A função padrao de teste para coincidência é sequal
.
Se smismatch
pode ignorar a caixa alta/baixa, use sequalignore
como função de teste.
(%i1) smismatch("seven","seventh"); (%o1) 6
Retorna a lista de todas as fichas em seq_caracte.
Cada ficha é uma seqüência de caracteres não analisada.
split
usa delim como delimitador.
Se delim não for fornecido, o caractere de espaço é o delimitador padrão.
multiple é uma variável booleana com true
como valor padrão.
Multiplos delimitadores são lidos como um.
Essa função é útil se tabulações são gravadas com caracteres de espaço multiplos.
Se multiple for escolhido para false
, cada delimitador é considerado.
(%i1) split("1.2 2.3 3.4 4.5"); (%o1) [1.2, 2.3, 3.4, 4.5] (%i2) split("first;;third;fourth",";",false); (%o2) [first, , third, fourth]
Retorna a posição do primeiro caractere em seq_caracte que coincide com caractere.
O primeiro caractere em seq_caracte está na posição 1.
Para que os caracteres que coincidirem desconsiderem a caixa alta/baixa veja ssearch
.
Retorna uma seqüência de caracteres como seq_caracte mas com todas as subseqüências de caracteres que coincidirem com seq.
A função padrão de teste de coincidência é sequal
.
Se sremove
puder ignorar a caixa alta/baixa enquanto busca por seq, use sequalignore
como teste.
Use início e fim para limitar a busca.
Note que o primeiro caractere em seq_caracte está na posição 1.
(%i1) sremove("n't","I don't like coffee."); (%o1) I do like coffee. (%i2) sremove ("DO ",%,'sequalignore); (%o2) I like coffee.
Como em sremove
exceto qie a primeira subseqüência de caracteres que coincide com seq
é removida.
Retorna uma seqüência de caracteres com todos os caracteres de seq_caracte em ordem reversa.
Retorna a posição da primeira subseqüência de caracteres de seq_caracte que coincide com a seqüência de caracteres seq.
A função padrão de teste de coincidência é sequal
.
Se ssearch
puder igonorar a caixa alta/baixa, use sequalignore
como função de teste.
Use início e fim para limitar a busca.
Note que o primeiro caractere em seq_caracte está na posição 1.
(%i1) ssearch("~s","~{~S ~}~%",'sequalignore); (%o1) 4
Retorna uma seqüência de caracteres que contém todos os caracteres de seq_caracte em uma ordem tal que não existam dois caracteres c sucessivos e d seja tal que test (c, d)
seja false
e test (d, c)
seja true
.
A função padrão de teste para ordenaçào é clessp.
O conjunto de funções de teste é {clessp, clesspignore, cgreaterp, cgreaterpignore, cequal, cequalignore}
.
(%i1) ssort("I don't like Mondays."); (%o1) '.IMaddeiklnnoosty (%i2) ssort("I don't like Mondays.",'cgreaterpignore); (%o2) ytsoonnMlkIiedda.'
Retorna uma seqüência de caracteres como seq_caracte exceto que todas as subseqüências de caracteres que coincidirem com antiga são substituídas por nova.
antiga e nova não precisam ser de mesmo comprimento.
A função padrão de teste para coincidência é para coincidências é sequal
.
Se ssubst
puder ignorar a cixa alta/baixa enquanto procurando por antiga, use sequalignore
como função de teste.
Use início e fim para limitar a busca.
Note que o primeiro caractere em seq_caracte está na posição 1.
(%i1) ssubst("like","hate","I hate Thai food. I hate green tea."); (%o1) I like Thai food. I like green tea. (%i2) ssubst("Indian","thai",%,'sequalignore,8,12); (%o2) I like Indian food. I like green tea.
Como em subst
exceto que somente a primeira subseqüência de caracteres que coincidir com antiga é substituída.
Retorna uma seqüência de caracteres como seq_caracte, mas com todos os caracteres que aparecerem em seq removidos de ambas as extremidades.
(%i1) "/* comment */"$ (%i2) strim(" /*",%); (%o2) comment (%i3) slength(%); (%o3) 7
Como em strim
exceto que somente a extremidade esquerda de seq_caracte é recordada.
Como em strim
exceto que somente a extremidade direita de seqüência de caracteres é recortada.
Retorna a subseqüência de caracteres de seq_caracte começando na posição início e terminando na posição fim. O caractere na posição fim não é incluído. Se fim não for fornecido, a subseqüência de caracteres contém o restante da seqüência de caracteres. Note que o primeiro caractere em seq_caracte está na posição 1.
(%i1) substring("substring",4); (%o1) string (%i2) substring(%,4,6); (%o2) in
Retorna seq_caracte exceto que caracteres em caixa baixa a partir da posição início até a posição fim são substituídos pelo correspondente caracteres em caixa alta. Se fim não for fornecido, todos os caracteres em caixa baixa de início até o fim de seq_caracte são substituídos.
(%i1) load("stringproc")$ (%i1) supcase("english",1,2); (%o1) English
Retorna uma lista de fichas, que tiverem sido extrídos de seq_caracte.
As fichas são subseqüências de caracteres cujos caracteres satisfazem a uma determinada função de teste.
Se o teste não for fornecido, constituent é usada como teste padrão.
{constituent, alphacharp, digitcharp, lowercasep, uppercasep, charp, characterp, alphanumericp}
é o conjunto de fnções de teste.
(A verão Lisp de tokens
é escrita por Paul Graham. ANSI Common Lisp, 1996, page 67.)
(%i1) tokens("24 October 2005"); (%o1) [24, October, 2005] (%i2) tokens("05-10-24",'digitcharp); (%o2) [05, 10, 24] (%i3) map(parsetoken,%); (%o3) [5, 10, 24]
[ << ] | [ >> ] | [Top] | [Contents] | [Índice] | [ ? ] |
This document was generated by Robert Dodier on Dezembro, 29 2019 using texi2html 1.76.