Was jeder Java-Entwickler ¨uber Strings wissen sollte
Was jeder Java-Entwickler ¨uber
Strings wissen sollte
Bernd M¨uller
...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Vor vielen, vielen Jahren . . .
Vor vielen, vielen Jahren . . .
Bern...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Vor vielen, vielen Jahren . . .
Vor vielen, vielen Jahren . . .
publ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Referent
Vorstellung Referent
Prof. Informatik (Ostfalia, HS Braunsc...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
Motivation
Bernd M¨uller Java Forum Nord 20.10.2016 5/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
Bernd M¨uller Java Forum Nord 20.10.2016 6/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation


¨
©
Bernd M¨uller Java Forum Nord 20.10.2016 7/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
Auszug aus Abschnitt String Interning
”
Strings are, far ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
Bernd M¨uller Java Forum Nord 20.10.2016 9/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
9
8
6
7
Bernd M¨uller Java Forum Nord 20.10.2016 10/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
Bernd M¨uller Java Forum Nord 20.10.2016 11/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Motivation
9
8
6
7
Bernd M¨uller Java Forum Nord 20.10.2016 12/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
String-Klassen
String-Klassen und -Methoden
Bernd M¨uller Java Forum...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
String-Klassen
Klassen mit String-Bezug: die ¨ublichen Verd¨achtigen...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
String-Klassen
Padding
Padding in der Regel mit Apache Commons-Lang
...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Character-Codierungen
Character-Codierungen
Bernd M¨uller Java Forum...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Character-Codierungen
Character-Codierungen
Historisch Java mit 16 B...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Character-Codierungen
Java Tutorial: Supplementary Characters as Sur...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Character-Codierungen
Character-Codierungen (cont’d)
Beschreibung in...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz
Bernd M¨uller Java Forum Nord 20.10.2016 20/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: toString()
Performanz: toString()
Bernd M¨ull...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: toString()
Who Cares About toString Performan...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: toString()
Who Cares About toString Performan...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: toString()
Who Cares About toString Performan...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: String-Konkatenation
Performanz: String-Konka...
JDK String-Konkatenation
@Benchmark
// String +
public static String concat () {
String result = ;
for (int i = 0; i  IT; ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Performanz
Performanz: String-Konkatenation
JMH Ergebnisse
Benchmark...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Internte Strings
Bernd M¨uller Java Forum Nord 20.1...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Was ist das ?
Internte Strings — Was ist das ?
Bern...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Was ist das ?
Internte Strings
Moreover, a string l...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Was ist das ?
Internte String-Literale — Beispiele
...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Am¨usantes
Am¨usantes
Bernd M¨uller Java Forum Nord...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Am¨usantes
Spielereien
Was ist die Ausgabe?
System....
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Am¨usantes
Spielereien (cont’d)
Was ist die Ausgabe...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Nochmal Performanz
Nochmal Performanz
Bernd M¨uller...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Nochmal Performanz
Java-Doc String.intern()
Returns...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Nochmal Performanz
Performanz-Idee: String-Internin...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Nochmal Performanz
Java Performance, Scott Oaks
”
L...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Und nochmal Performanz
Und nochmal Performanz
Bernd...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Und nochmal Performanz
Auch bitte nicht selbst vers...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Implementierung
Implementierung
Bernd M¨uller Java ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Internte Strings
Implementierung
Der String-Pool
Implementiert als H...
Beispiele -XX:+PrintStringTableStatistics
StringTable statistics:
Number of buckets : 1003
Average bucket size : 33
Varian...
In Java 8 ausf¨uhrlichere Informationen
StringTable statistics:
Number of buckets : 60013 = 480104 bytes , avg 8,000
Numbe...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
GC1 String-Deduplication
GC1 + JVM-Optionen
Bernd M¨uller Java Forum...
JEP 192: String Deduplication in G1 [JEP192]
Summary
”
Reduce the Java heap live-data set by enhancing the G1 garbage
coll...
-XX:+UseG1GC -XX:+UseStringDeduplication
String tmp = some string;
String string1 = new String(tmp + tmp);
String string2 ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
GC1 String-Deduplication
Erfahrungsbericht
Artikel G1: from garbage ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
Dies und das
Bernd M¨uller Java Forum Nord 20.10.2016 4...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
Heinz Kabutz, Reflection Madness, JAX London 2014
Java 1...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
Andere String-relevante VM-Optionen
-XX:+UseStringCache...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
Ausblick — es geht immer weiter . . .
JEP 254: Compact ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
Wer an Schnittstellen vorbei programmiert,
ist selbst s...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
String-Interna vor JEP 254
/** The value is used for ch...
String-Interna nach JEP 254
/**
* The value is used for character storage .
*
* @implNote This field is trusted by the VM ...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Dies und das
magic() ¨uberarbeitet
Wirft mit Java 9 Exception:
java....
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Fragen und Anmerkungen
Fragen und Anmerkungen
Bernd M¨uller Java For...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Referenzen
Referenzen
Bernd M¨uller Java Forum Nord 20.10.2016 58/60
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Referenzen
Referenzen
[Gonc] Antonio Goncalves: Who Cares About toSt...
Was jeder Java-Entwickler ¨uber Strings wissen sollte
Referenzen
Referenzen (cont’d)
[CHAR1] Supplementary Characters in t...
Nächste SlideShare
Wird geladen in …5
×

Was jeder Java-Entwickler über Strings wissen sollte

210 Aufrufe

Veröffentlicht am

Strings sind wahrscheinlich der am meisten verwendete Datentyp in jeder
Java-Anwendung. Es ist daher nicht überraschend, dass JDK-Ingenieure
versuchen, Strings möglichst gut zu optimieren oder Bücher über
Performanz-Tuning und Testen dem Thema Strings ganze Kapitel widmen.

Jeder Entwickler sollte daher wissen, was Strings sind und wie sie
sinnvoll und effizient eingesetzt werden können.

Dieser Vortrag stellt JDK-Klassen vor, die mit und auf Strings
arbeiten, sowohl auf der API- aber auch auf der
Implementierungsebene. Wir beleuchten internte Strings und die für sie
verwendeten Speicherbereiche, sowie die noch recht unbekannte
"String-Deduplication"-Option des G1-Garbage-Collectors.

Mit Java 9 ändert sich die interne Repräsentation von Strings.
Wir skizzieren diese Änderungen, die nach außen unsichtbar
bleiben.

Veröffentlicht in: Software
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
210
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
0
Aktionen
Geteilt
0
Downloads
3
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Was jeder Java-Entwickler über Strings wissen sollte

  1. 1. Was jeder Java-Entwickler ¨uber Strings wissen sollte Was jeder Java-Entwickler ¨uber Strings wissen sollte Bernd M¨uller Java Forum Nord 20.10.2016 Bernd M¨uller Java Forum Nord 20.10.2016 1/60
  2. 2. Was jeder Java-Entwickler ¨uber Strings wissen sollte Vor vielen, vielen Jahren . . . Vor vielen, vielen Jahren . . . Bernd M¨uller Java Forum Nord 20.10.2016 2/60
  3. 3. Was jeder Java-Entwickler ¨uber Strings wissen sollte Vor vielen, vielen Jahren . . . Vor vielen, vielen Jahren . . . public class HelloWorld { public static void main(String [] args) { System.out.println("Hello World"); } } Was ist ” String[]“ ? Was ist ” ”Hello World”“ ? Hat das irgend etwas miteinander zu tun ? Bernd M¨uller Java Forum Nord 20.10.2016 3/60
  4. 4. Was jeder Java-Entwickler ¨uber Strings wissen sollte Referent Vorstellung Referent Prof. Informatik (Ostfalia, HS Braunschweig/Wolfenb¨uttel) Buchautor (JSF, Seam, JPA, ...) Mitglied EGs JSR 344 (JSF 2.2) und JSR 338 (JPA 2.1) Gesch¨aftsf¨uhrer PMST GmbH . . . Bernd M¨uller Java Forum Nord 20.10.2016 4/60
  5. 5. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation Motivation Bernd M¨uller Java Forum Nord 20.10.2016 5/60
  6. 6. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation Bernd M¨uller Java Forum Nord 20.10.2016 6/60
  7. 7. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation ¨ © Bernd M¨uller Java Forum Nord 20.10.2016 7/60
  8. 8. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation Auszug aus Abschnitt String Interning ” Strings are, far and away, the most common Java object; your application’s heap is almost certainly filled with them.“ Bernd M¨uller Java Forum Nord 20.10.2016 8/60
  9. 9. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation Bernd M¨uller Java Forum Nord 20.10.2016 9/60
  10. 10. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation 9 8 6 7 Bernd M¨uller Java Forum Nord 20.10.2016 10/60
  11. 11. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation Bernd M¨uller Java Forum Nord 20.10.2016 11/60
  12. 12. Was jeder Java-Entwickler ¨uber Strings wissen sollte Motivation 9 8 6 7 Bernd M¨uller Java Forum Nord 20.10.2016 12/60
  13. 13. Was jeder Java-Entwickler ¨uber Strings wissen sollte String-Klassen String-Klassen und -Methoden Bernd M¨uller Java Forum Nord 20.10.2016 13/60
  14. 14. Was jeder Java-Entwickler ¨uber Strings wissen sollte String-Klassen Klassen mit String-Bezug: die ¨ublichen Verd¨achtigen java.lang.String, seit Java 1.0 The String class represents character strings. java.lang.StringBuffer, seit Java 1.0 A thread-safe, mutable sequence of characters. java.lang.StringBuilder, seit Java 5 A mutable sequence of characters. java.util.StringTokenizer, seit Java 1.0 The string tokenizer class allows an application to break a string into tokens. java.util.StringJoiner, seit Java 8 StringJoiner is used to construct a sequence of characters separated by a delimiter . . . Bernd M¨uller Java Forum Nord 20.10.2016 14/60
  15. 15. Was jeder Java-Entwickler ¨uber Strings wissen sollte String-Klassen Padding Padding in der Regel mit Apache Commons-Lang StringUtils: leftPad(), rightPad() Man ben¨otigt aber keine Bibliothek, ist im SDK eingebaut Schl¨ussel: java.util.Formatter als printf-Nachahmung Beispiel: String.format(%1 $10s, hello) String.format(%1$-10s, hello) Bernd M¨uller Java Forum Nord 20.10.2016 15/60
  16. 16. Was jeder Java-Entwickler ¨uber Strings wissen sollte Character-Codierungen Character-Codierungen Bernd M¨uller Java Forum Nord 20.10.2016 16/60
  17. 17. Was jeder Java-Entwickler ¨uber Strings wissen sollte Character-Codierungen Character-Codierungen Historisch Java mit 16 Bit codiertem char-Datentyp Mit Java 5 wurde Unicode 4.0 als Character-Codierung eingef¨uhrt [CHAR1] Damit Codierungen mit mehr als 16 Bit m¨oglich, die als sogenannte Surrogate repr¨asentiert werden Bernd M¨uller Java Forum Nord 20.10.2016 17/60
  18. 18. Was jeder Java-Entwickler ¨uber Strings wissen sollte Character-Codierungen Java Tutorial: Supplementary Characters as Surrogates ” To support supplementary characters without changing the char primitive data type and causing incompatibility with previous Java programs, supplementary characters are defined by a pair of code point values that are called surrogates. The first code point is from the high surrogates range of U+D800 to U+DFBB, and the second code point is from the low surrogates range of U+DC00 to U+DFFF. For example, the Deseret character LONG I, U+10400, is defined with this pair of surrogate values: U+D801 and U+DC00.“ [CHAR2] Bernd M¨uller Java Forum Nord 20.10.2016 18/60
  19. 19. Was jeder Java-Entwickler ¨uber Strings wissen sollte Character-Codierungen Character-Codierungen (cont’d) Beschreibung in Java-Doc java.lang.Character [CHAR4] ¨Uberblick Java 1.4: Unicode 3.0 Java 5: Unicode 4.0 Java 6: Unicode 4.0 Java 7: Unicode 6.0.0 Java 8: Unicode 6.2.0 Java 9: Unicode 8.0.0 Basic Encodings in lib/rt.jar, Extended Encodings in lib/charsets.jar, Dokumentation in [CHAR3] Bernd M¨uller Java Forum Nord 20.10.2016 19/60
  20. 20. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz Bernd M¨uller Java Forum Nord 20.10.2016 20/60
  21. 21. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: toString() Performanz: toString() Bernd M¨uller Java Forum Nord 20.10.2016 21/60
  22. 22. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: toString() Who Cares About toString Performance ? Blog von Antonio Goncalves [Gonc] Use Case: Großer Batch mit Logging und toString(), o.¨a. Effective Java [Joshua Bloch] Item 10: Always override toString toString()-Methode durch IDE generiert oder selbst gemacht mit Alternativen Null-Checks nicht vergessen Untersucht: JDK, Guava, CommonsLang3 Gemessen: ” Average performance with Java Microbenchmarking Harness (ops/s)“ Bernd M¨uller Java Forum Nord 20.10.2016 22/60
  23. 23. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: toString() Who Cares About toString Performance ? (cont’d) Ergebnisse Technic Average ops/s String concat with + 142.075,167 String builder 141.463,438 Objects.toString 140.791,365 Guava 110.111,808 ToStringBuilder (append) 75.165,552 ToStringBuilder (reflectionToString) 34.930,630 ReflectionToStringBuilder 23.204,479 Bernd M¨uller Java Forum Nord 20.10.2016 23/60
  24. 24. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: toString() Who Cares About toString Performance? (cont’d) Zusammenfassung: ” Today with the JVM optimisation, we can safely use the + symbol to concatenate Strings (and use Objects.toString to handle nulls). With the utility class Objects that is built-in the JDK, no need to have external frameworks to deal with null values. So, out of the box, the JDK has better performance than any other technic described in this article.“ [Antonio Goncalves, Gonc] Nachtrag: sowieso nur interessant, wenn Sie toString() sehr oft aufrufen Bernd M¨uller Java Forum Nord 20.10.2016 24/60
  25. 25. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: String-Konkatenation Performanz: String-Konkatenation Bernd M¨uller Java Forum Nord 20.10.2016 25/60
  26. 26. JDK String-Konkatenation @Benchmark // String + public static String concat () { String result = ; for (int i = 0; i IT; i++) { result += i; } return result; } @Benchmark // StringBuffer public static String concat () { StringBuffer builder = new Stri for (int i = 0; i IT; i++) { builder.append(i); } return builder.toString (); } @Benchmark // Joining Collector public static String concat () { return IntStream.range (0, IT) .mapToObj(String :: valueOf) .collect(Collectors.joining ()); } @Benchmark // StringBuilder public static String concat () { StringBuilder builder = new Str for (int i = 0; i IT; i++) { builder.append(i); } return builder.toString (); }
  27. 27. Was jeder Java-Entwickler ¨uber Strings wissen sollte Performanz Performanz: String-Konkatenation JMH Ergebnisse Benchmark Score Error Units SC.concatWithJoiningCollector 2898,767 ± 5,378 ops/s SC.concatWithString 25,434 ± 0,059 ops/s SC.concatWithStringBuffer 5375,578 ± 39,959 ops/s SC.concatWithStringBuilder 6030,804 ± 13,088 ops/s Bernd M¨uller Java Forum Nord 20.10.2016 27/60
  28. 28. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Internte Strings Bernd M¨uller Java Forum Nord 20.10.2016 28/60
  29. 29. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Was ist das ? Internte Strings — Was ist das ? Bernd M¨uller Java Forum Nord 20.10.2016 29/60
  30. 30. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Was ist das ? Internte Strings Moreover, a string literal always refers to the same instance of class String. This is because string literals - or, more generally, strings that are the values of constant expressions (§15.28) - are ”interned” so as to share unique instances, using the method String.intern. [JLS 3.10.5 String Literals] String-Memory-Pool mit allen internten Strings Beim Laden einer Klasse in die VM wird gepr¨uft, ob String-Literal schon im Pool Falls ja, wird es wiederverwendet, falls nein, neu eingetragen String-Literale gibt es also nur einmal in einer VM Bernd M¨uller Java Forum Nord 20.10.2016 30/60
  31. 31. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Was ist das ? Internte String-Literale — Beispiele String str1 = Hello , World!; String str2 = Hello , World!; String str3 = new String(Hello , World!); // sinnlos Assert.assertSame(Hello , World!, Hello , World!); Assert.assertSame(str1 , str2 ); Assert.assertSame(Hel + lo, Hel + lo); Assert.assertNotSame(str1 + str1 , str2 + str2 ); Assert.assertEquals(str1 + str1 , str2 + str2 ); Assert.assertSame (( str1 + str1 ). intern (), (str2 + str2 ). intern ()); Assert.assertNotSame(str1 , str3 ); Bernd M¨uller Java Forum Nord 20.10.2016 31/60
  32. 32. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Am¨usantes Am¨usantes Bernd M¨uller Java Forum Nord 20.10.2016 32/60
  33. 33. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Am¨usantes Spielereien Was ist die Ausgabe? System.out.println(Hello , World!); magic (); System.out.println(Hello , World!); private static void magic () throws Exception { Field field = String.class . getDeclaredField (value); field.setAccessible(true ); field.set(Hello , World!, tricky intern.toCharArray ()); } Zuerst gesehen bei Arno Haase Bitte nicht nachmachen Bernd M¨uller Java Forum Nord 20.10.2016 33/60
  34. 34. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Am¨usantes Spielereien (cont’d) Was ist die Ausgabe? System.out.println(Hello , World!); magic (); System.out.println(Hello , World!); public static void magic () throws Exception { Field field = String.class . getDeclaredField (value); field.setAccessible(true ); char [] chars = (char []) field.get(Hello World); System.arraycopy(tricky intern.toCharArray (), 0, chars , 0, chars.length ); } Ebenfalls nicht nachmachen Bernd M¨uller Java Forum Nord 20.10.2016 34/60
  35. 35. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Nochmal Performanz Nochmal Performanz Bernd M¨uller Java Forum Nord 20.10.2016 35/60
  36. 36. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Nochmal Performanz Java-Doc String.intern() Returns a canonical representation for the string object. A pool of strings, initially empty, is maintained privately by the class String. When the intern method is invoked, if the pool already contains a string equal to this String object as determined by the equals(Object) method, then the string from the pool is returned. Otherwise, this String object is added to the pool and a reference to this String object is returned. It follows that for any two strings s and t, s.intern() == t.intern() is true if and only if s.equals(t) is true. All literal strings and string-valued constant expressions are interned. String literals are defined in section 3.10.5 of the The JavaTM Language Specification. Returns: a string that has the same contents as this string, but is guaranteed to be from a pool of unique strings. Bernd M¨uller Java Forum Nord 20.10.2016 36/60
  37. 37. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Nochmal Performanz Performanz-Idee: String-Interning und Equals ” On the topic of interning strings, what about using the intern() method to make the programm run faster, since interned strings can be compared via the == operator? That is a popular thought, though in most cases it turns out to by a myth. The String.equals() method is pretty fast. . . . Comparing strings via the == operator is undeniably faster, but the cost of interning the string must also be taken into consideration.“ [Java Performance, Scott Oaks] Bernd M¨uller Java Forum Nord 20.10.2016 37/60
  38. 38. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Nochmal Performanz Java Performance, Scott Oaks ” Like most optimizations, interning strings shouldn’t be done arbitrarily, but it can be effective if there are lots of duplicate strings occupying a significant portion of the heap.“ Bernd M¨uller Java Forum Nord 20.10.2016 38/60
  39. 39. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Und nochmal Performanz Und nochmal Performanz Bernd M¨uller Java Forum Nord 20.10.2016 39/60
  40. 40. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Und nochmal Performanz Auch bitte nicht selbst versuchen: MyString ” In compiler theory, an intrinsic function is a function available for use in a given programming language whose implementation is handled specially by the compiler. Typically, it substitutes a sequence of automatically generated instructions for the original function call, similar to an inline function. Unlike an inline function though, the compiler has an intimate knowledge of the intrinsic function and can therefore better integrate it and optimize it for the situation.“[Wikipedia,Intr1] In Java Compiler, JIT, evtl. sogar in JVM eingebaut String.equals() ist intrinsic. String.indexOf(), String.compareTo() ebenfalls [Krystal Mo,Intr2] String.intern() ist sogar nativ implementiert Bernd M¨uller Java Forum Nord 20.10.2016 40/60
  41. 41. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Implementierung Implementierung Bernd M¨uller Java Forum Nord 20.10.2016 41/60
  42. 42. Was jeder Java-Entwickler ¨uber Strings wissen sollte Internte Strings Implementierung Der String-Pool Implementiert als Hashtable fester Gr¨oße Bucket-Gr¨oße ab Java 6 einstellbar Nativ in JVM realisiert, Gr¨oße nicht ver¨anderbar In Java 6 in Permanent Generation, 7 und h¨oher im Heap Daher in Java 6 OOME: PermGen space Java 7 und h¨oher OOME: Java heap space Gr¨oßen: Vor Java 7u40 1009 Buckets Java 7u40 und sp¨ater 60013 VM-Schalter: -XX:StringTableSize=value -XX:+PrintStringTableStatistics (Java 7u6 und gr¨oßer, 6u32 Backport) Bernd M¨uller Java Forum Nord 20.10.2016 42/60
  43. 43. Beispiele -XX:+PrintStringTableStatistics StringTable statistics: Number of buckets : 1003 Average bucket size : 33 Variance of bucket size : 33 Std. dev. of bucket size: 6 Maximum bucket size : 51 Schlecht StringTable statistics: Number of buckets : 60013 Average bucket size : 1 Variance of bucket size : 1 Std. dev. of bucket size: 1 Maximum bucket size : 10Viel besser StringTable statistics: Number of buckets : 60013 Average bucket size : 0 Variance of bucket size : 0 Std. dev. of bucket size: 1 Maximum bucket size : 5 Empfehlenswert
  44. 44. In Java 8 ausf¨uhrlichere Informationen StringTable statistics: Number of buckets : 60013 = 480104 bytes , avg 8,000 Number of entries : 797 = 19128 bytes , avg 24 ,000 Number of literals : 797 = 151960 bytes , avg 190 ,665 Total footprint : = 651192 bytes Average bucket size : 0,013 Variance of bucket size : 0,013 Std. dev. of bucket size: 0,115 Maximum bucket size : 2
  45. 45. Was jeder Java-Entwickler ¨uber Strings wissen sollte GC1 String-Deduplication GC1 + JVM-Optionen Bernd M¨uller Java Forum Nord 20.10.2016 45/60
  46. 46. JEP 192: String Deduplication in G1 [JEP192] Summary ” Reduce the Java heap live-data set by enhancing the G1 garbage collector so that duplicate instances of String are automatically and continuously deduplicated. “ Motivation ” . . . Measurements have shown that roughly 25% of the Java heap live data set in these types of applications is consumed by String objects. . . . roughly half of those String objects are duplicates . . . Having duplicate String objects on the heap is, essentially, just a waste of memory“ Description ” The value field is implementation-specific and not observable from outside . . . This means that it can safely and transparently be used by multiple instances of String at the same time. Deduplicating a String object is conceptually just an re-assignment of the value field, i.e., aString.value = anotherString.value.
  47. 47. -XX:+UseG1GC -XX:+UseStringDeduplication String tmp = some string; String string1 = new String(tmp + tmp); String string2 = new String(tmp + tmp); Field field = String.class. getDeclaredField (value); field.setAccessible(true ); Assert.assertEquals(string1 , string2 ); Assert.assertNotSame(string1 , string2 ); Assert.assertNotSame(field.get(string1), field.get(string2 )); System.gc(); Thread.sleep (1000); Assert.assertNotSame(string1 , string2 ); Assert.assertSame(field.get(string1), field.get(string2 ));
  48. 48. Was jeder Java-Entwickler ¨uber Strings wissen sollte GC1 String-Deduplication Erfahrungsbericht Artikel G1: from garbage collector to waste management consultant von Erik Costlow, 24.3.2016, Java Platform Group, Product Management blog Aussage: String Deduplication may decrease heap usage by about 10% Am Beispiel Eclipse Referenz: [DEDUP] Seit Neon in eclipse.ini Bernd M¨uller Java Forum Nord 20.10.2016 48/60
  49. 49. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das Dies und das Bernd M¨uller Java Forum Nord 20.10.2016 49/60
  50. 50. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das Heinz Kabutz, Reflection Madness, JAX London 2014 Java 1.0 - 1.2 String contained char[], offset, count Java 1.3 - 1.6 Added a cached hash code String became a shared, mutable, but thread-safe class Java 1.7 Got rid of offset and length and added hash32 Java 1.8 Got rid of hash32 again Bernd M¨uller Java Forum Nord 20.10.2016 50/60
  51. 51. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das Andere String-relevante VM-Optionen -XX:+UseStringCache ” Enables caching of commonly allocated strings.“ Keine weiteren Informationen gefunden. Vorhanden in Java 6 und 7. Entfernt in Java 8 -XX:+UseCompressedStrings ” Use a byte[] for Strings which can be represented as pure ASCII.“ Eingef¨uhrt in Java 6u21. Wieder entfernt in Java 7 -XX:+OptimizeStringConcat ” Optimize String concatenation operations where possible.“ Eingef¨uhrt in Java 6u20. Optimiert wiederholte StringBuilder append()-Aufrufe Bernd M¨uller Java Forum Nord 20.10.2016 51/60
  52. 52. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das Ausblick — es geht immer weiter . . . JEP 254: Compact Strings [JEP254] Bereits 8/2014 definiert ” Wiederbelebung“ von -XX:+UseCompressedStrings kodiert Zeichen als ISO-8859-1/Latin-1 (1 Byte pro Zeichen) oder UTF-16 (2 Bytes pro Zeichen) Marker zur Kennzeichnung JavaOne 2015, CON5483: Compact Strings: A Memory-Efficient Internal Representation for Strings Gemeinsames Projekt von Oracle und Intel, 10+ Entwickler Kommt in Java 9. In neueren EAs enthalten Bernd M¨uller Java Forum Nord 20.10.2016 52/60
  53. 53. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das Wer an Schnittstellen vorbei programmiert, ist selbst schuld . . . Große Diskussion: sun.misc.Unsafe Hier: magic(), in Abschnitt Am¨usantes . . . schauen wir uns die Details an . . . Bernd M¨uller Java Forum Nord 20.10.2016 53/60
  54. 54. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das String-Interna vor JEP 254 /** The value is used for character storage. */ private final char value []; Bernd M¨uller Java Forum Nord 20.10.2016 54/60
  55. 55. String-Interna nach JEP 254 /** * The value is used for character storage . * * @implNote This field is trusted by the VM , and is a subject to * constant folding if String instance is constant . Overwriting this * field after construction will cause problems . * * Additionally , it is marked with { @link Stable } to trust the contents * of the array. No other facility in JDK provides this functionality (yet ). * {@link Stable } is safe here , because value is never null. */ @Stable private final byte [] value; /** * The identifier of the encoding used to encode the bytes in * {@code value }. The supported values in this implementation are * * LATIN1 * UTF16 * * @implNote This field is trusted by the VM , and is a subject to * constant folding if String instance is constant . Overwriting this * field after construction will cause problems . */ private final byte coder;
  56. 56. Was jeder Java-Entwickler ¨uber Strings wissen sollte Dies und das magic() ¨uberarbeitet Wirft mit Java 9 Exception: java.lang. IllegalArgumentException : Can not set final [B field java.lang.String.value to [C ¨Uberarbeitung: aus private static void magic () throws Exception { Field field = String.class. getDeclaredField (value); field. setAccessible (true ); field.set(Hello , World!, tricky intern.toCharArray ()); } wird private static void magic () throws Exception { Field field = String.class. getDeclaredField (value); field. setAccessible (true ); field.set(Hello , World!, tricky intern.getBytes ()); } Bernd M¨uller Java Forum Nord 20.10.2016 56/60
  57. 57. Was jeder Java-Entwickler ¨uber Strings wissen sollte Fragen und Anmerkungen Fragen und Anmerkungen Bernd M¨uller Java Forum Nord 20.10.2016 57/60
  58. 58. Was jeder Java-Entwickler ¨uber Strings wissen sollte Referenzen Referenzen Bernd M¨uller Java Forum Nord 20.10.2016 58/60
  59. 59. Was jeder Java-Entwickler ¨uber Strings wissen sollte Referenzen Referenzen [Gonc] Antonio Goncalves: Who Cares About toString Performance? [Intr1] Wikipedia: Intrinsic function [Intr2] Krystal Mo. Intrinsic Methods in HotSpot VM [Bug1] JDK-6962931: move interned strings out of the perm gen [Bug2] JDK-6964458: Reimplement class meta-data storage to use native memory [Bug3] JDK-4513622: (str) keeping a substring of a field prevents GC for object [JEP192] JEP 192: String Deduplication in G1 [JEP254] JEP 254: Compact Strings [DEDUP] G1: from garbage collector to waste management consultant Bernd M¨uller Java Forum Nord 20.10.2016 59/60
  60. 60. Was jeder Java-Entwickler ¨uber Strings wissen sollte Referenzen Referenzen (cont’d) [CHAR1] Supplementary Characters in the Java Platform [CHAR2] Supplementary Characters as Surrogates [CHAR3] Unicode Character Representations [CHAR4] Supported Encodings [CHAR5] Unicode 4.0 support in J2SE 1.5 Bernd M¨uller Java Forum Nord 20.10.2016 60/60

×